Pada artikel ini, kita akan berbicara tentang solusi TCN inovatif terbaru. Untuk memulainya, dengan menggunakan contoh detektor gerakan, kami akan mempertimbangkan arsitektur Jaringan Konvolusional Temporal dan keunggulannya dibandingkan pendekatan tradisional seperti Jaringan Neural Konvolusional (CNN) dan Jaringan Neural Berulang (RNN). Kami kemudian berbicara tentang contoh terbaru dari aplikasi TCN, termasuk prediksi lalu lintas yang ditingkatkan, pelokalisasi dan detektor suara, dan prediksi probabilistik.
Gambaran singkat tentang TCN
Karya dasar Lea et al. (2016) memelopori penggunaan jaringan konvolusional temporal untuk membagi tindakan berbasis video. Biasanya, proses ini dibagi menjadi dua tahap: pertama, perhitungan fitur tingkat rendah menggunakan (paling sering) CNN, yang mengkodekan informasi spatio-temporal, dan kedua, memasukkan fitur tingkat rendah ke dalam pengklasifikasi, yang menerima informasi temporal tingkat tinggi menggunakan (paling sering ) RNN. Kerugian utama dari pendekatan ini adalah kebutuhan akan dua model terpisah. TCN menawarkan pendekatan terpadu untuk mencakup kedua tingkat informasi secara hierarkis.
Gambar di bawah ini menunjukkan struktur encoder-decoder, informasi tentang arsitektur dapat ditemukan di dua tautan pertama di akhir artikel. Pertanyaan paling kritis diselesaikan sebagai berikut: TCN dapat mengambil rangkaian dengan panjang berapa pun dan mendapatkan keluaran yang sama. Konvolusi kasual digunakan di mana terdapat arsitektur jaringan satu dimensi konvolusional penuh. Karakteristik utamanya adalah bahwa nilai keluaran pada waktu t diciutkan hanya dengan item-item yang terjadi pada waktu sebelumnya.
Buzz di sekitar TCN bahkan telah sampai ke Alam, dengan publikasi terbaru Jan et al. (2020) tentang penggunaan TCN dalam prakiraan cuaca. Dalam pekerjaan mereka, penulis melakukan percobaan yang membandingkan TCN dan LSTM. Salah satu hasilnya adalah kesimpulan bahwa TCN melakukan pekerjaan prediksi deret waktu dengan baik.
Bagian berikut menyajikan implementasi dan ekstensi TCN klasik.
Prediksi lalu lintas yang lebih baik
Layanan berbagi tumpangan dan navigasi online dapat meningkatkan prakiraan lalu lintas dan meningkatkan pengalaman jalan raya. Mengurangi kemacetan lalu lintas, mengurangi polusi, mengemudi dengan aman dan cepat hanyalah beberapa dari tujuan yang dapat dicapai dengan meningkatkan prakiraan lalu lintas. Karena masalah ini didasarkan pada data waktu nyata, data lalu lintas yang terkumpul harus digunakan. Untuk alasan ini, Dai et al. (2020) baru-baru ini memperkenalkan Hybrid Spatio-Temporal Graph Convolutional Network (H-STGCN). Ide dasarnya adalah untuk memanfaatkan rasio kepadatan aliran geser linier sebagian dan mengubah volume lalu lintas yang akan datang menjadi waktu lalu lintas yang setara.Salah satu pendekatan paling menarik yang mereka gunakan dalam pekerjaan mereka adalah konvolusi grafik untuk mendapatkan ketergantungan waktu. Matriks ketetanggaan komposit mencerminkan karakteristik yang melekat dari perkiraan lalu lintas (baca artikel Lee 2017 untuk informasi lebih lanjut). Arsitektur berikut menyediakan empat modul untuk mendeskripsikan keseluruhan proses perkiraan.
Pelokalan dan deteksi peristiwa suara
Area lokalisasi dan sound event detection (SELF) terus berkembang. Dalam navigasi otonom, memahami lingkungan memainkan peran besar. Girjis et al. (2020) baru-baru ini mengusulkan arsitektur acara audio SELF-TCN yang baru. Sekelompok peneliti mengklaim bahwa kerangka kerja mereka mengungguli solusi saat ini di bidang ini, mengurangi waktu pelatihan. Dalam SELDnet mereka (arsitektur ditunjukkan di bawah), audio multichannel yang diambil sampelnya pada 44,1 kHz mengekstrak fase dan besaran spektrum menggunakan transformasi Fourier jangka pendek dan mengekstraknya sebagai fitur input terpisah. Kemudian blok konvolusional dan blok berulang (dua arah GRU) dihubungkan, dan kemudian blok yang sepenuhnya terhubung mengikuti. Saat keluar dari SELDnet, Anda bisa mendapatkan deteksi peristiwa audio dan arah asal audio tersebut.
Dan untuk mengungguli solusi yang ada, penulis memperkenalkan SELD-TCN:
Karena konvolusi yang diperpanjang memungkinkan jaringan untuk memproses input yang berbeda, jaringan yang lebih dalam mungkin diperlukan (yang akan dipengaruhi oleh gradien yang tidak stabil selama error backpropagation). Penulis penelitian mampu memecahkan masalah ini dengan mengadaptasi arsitektur WaveNet (Dario et al., 2017). Mereka menunjukkan bahwa lapisan berulang tidak diperlukan untuk tugas SELD, dan mereka dapat menentukan waktu mulai dan akhir dari peristiwa suara aktif.
Peramalan probabilistik
Kerangka baru yang dikembangkan oleh Chen et al. (2020) dapat diterapkan untuk memperkirakan kepadatan probabilitas. Perkiraan deret waktu meningkatkan banyak skenario keputusan bisnis (misalnya, manajemen sumber daya). Perkiraan probabilistik memungkinkan Anda mengekstrak informasi dari data historis dan meminimalkan ketidakpastian peristiwa di masa depan. Ketika tugas peramalan adalah memprediksi jutaan deret waktu terkait (seperti dalam bisnis ritel), dibutuhkan tenaga kerja dan sumber daya komputasi yang mahal untuk memperkirakan parameter. Untuk mengatasi kesulitan ini, penulis mengusulkan estimasi kepadatan berbasis CNN dan sistem peramalan. Struktur mereka dapat mempelajari korelasi tersembunyi antara rangkaian tersebut. Kebaruan ilmiah dalam pekerjaan mereka terletak pada TCN mendalam yang mereka usulkan, yang direpresentasikan dalam arsitektur mereka:
Penerapan modul encoder-decoder dapat membantu dalam pengembangan aplikasi skala besar.
Kesimpulan
Dalam artikel ini, kami meninjau pekerjaan terbaru yang terkait dengan jaringan konvolusional temporal, yang dalam satu atau lain cara lebih unggul dari pendekatan CNN dan RNN klasik dalam memecahkan masalah deret waktu.
Sumber
- Lea, Colin, dkk. "Jaringan konvolusional temporal: Pendekatan terpadu untuk tindakan segmentasi." Konferensi Eropa tentang Visi Komputer. Springer, Cham, 2016.
- Lea, Colin, dkk. "Jaringan konvolusional temporal untuk segmentasi dan deteksi tindakan." prosiding Konferensi IEEE tentang Visi Komputer dan Pengenalan Pola. 2017.
- Yan, Jining, dkk. "Jaringan konvolusional temporal untuk prediksi Advance enSo." Laporan Ilmiah 10.1 (2020): 1-15.
- Li, Yaguang, et al. “Diffusion convolutional recurrent neural network: Data-driven traffic forecasting.” arXiv preprint arXiv:1707.01926 (2017).
- Rethage, Dario, Jordi Pons, and Xavier Serra. “A wavenet for speech denoising.” 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018.
- Chen, Yitian, et al. “Probabilistic forecasting with temporal convolutional neural network.” Neurocomputing (2020).
- Guirguis, Karim, et al. “SELD-TCN: Sound Event Localization & Detection via Temporal Convolutional Networks.” arXiv preprint arXiv:2003.01609 (2020).