Jaringan saraf yang menjaga aturan lalu lintas



Pelanggaran aturan lalu lintas (SDA) oleh pengemudi membawa risiko operasional, reputasi dan hukum bagi organisasi.



Sebelumnya, rekaman video dari kendaraan resmi dianalisis untuk mengidentifikasi pelanggaran. Ini adalah proses rutin dan memakan waktu, karena volume video yang sangat besar diproses secara manual. Diputuskan untuk mengotomatisasi proses ini dan membuat model untuk mendeteksi pelanggaran lalu lintas untuk membentuk pemilihan video yang berorientasi risiko.



Pertama-tama, diputuskan untuk mencari pelanggaran lalu lintas bruto seperti melintasi garis padat ganda dan mengemudi di lampu merah.



Untuk segmentasi gambar dan deteksi marka jalan, jaringan saraf convolutional dari arsitektur U-Net digunakan. Arsitektur ini adalah urutan lapisan konvolusi dan penyatuan, yang pertama mengurangi resolusi spasial gambar, dan kemudian meningkatkannya, setelah sebelumnya menggabungkan gambar dengan data dan meneruskannya melalui lapisan konvolusi lainnya.



Untuk melatih model, diperlukan dataset pelatihan. Sayangnya, semua set data yang ditemukan dari akses terbuka terdiri dari foto-foto jalan bukan dari Rusia. Hasil pelatihan model jalan asing mengecewakan: model sering menolak untuk menganggap marka jalan domestik kita sebagai marka. Oleh karena itu, diputuskan untuk mulai membuat sampel pelatihan secara mandiri. Sekitar 1.500 tangkapan layar dipotong dari video dari perekam, dan roadbed ditandai pada mereka menggunakan layanan Supervise.ly (Gbr. 1).







Model yang dilatih pada dataset semacam itu menjadi mampu mengenali tanda jalan pada video kami dari perekam. Jaringan saraf menemukan garis-garis padat pada video dan, jika mengandung setidaknya sejumlah piksel yang telah ditentukan (sehingga garis acak, yang terputus-putus atau tidak padat tidak diperhitungkan), mendekati mereka menjadi garis lurus, yang tidak boleh lagi dilintasi oleh mobil kami.







Gambar 2 menunjukkan bagaimana U-Net bekerja: di atas adalah rekaman asli dari kaca depan, di bawah ini adalah contoh dari jaringan saraf, di mana area hijau adalah topeng penandaan jalan, dan garis merah tipis adalah perkiraan dari tanda garis.



Model ini menunjukkan dirinya dengan sangat baik dalam memproses sebagian besar video dari perekam, tetapi harus dicatat bahwa kesulitan muncul ketika menganalisis jalan yang tertutup salju atau video yang difilmkan dalam gelap - dalam beberapa kasus, tanda-tanda itu tidak terlihat.



Untuk menentukan keberadaan lampu lalu lintas dan mobil, jaringan saraf yang digunakan sebelumnya Darknet + Yolo v3 digunakan. Jaringan saraf ini adalah versi perbaikan dari arsitektur YOLO, yang merupakan singkatan dari You Only Look Once. Fitur utama YOLO v3 adalah memiliki tiga lapisan keluaran, yang masing-masing dirancang untuk mendeteksi objek dengan ukuran yang berbeda.



Fitur utama dari arsitektur ini dibandingkan dengan yang lain adalah bahwa sebagian besar sistem menerapkan jaringan saraf beberapa kali ke bagian gambar yang berbeda, dan di YOLO, jaringan saraf diterapkan ke seluruh gambar sekaligus dan sekaligus. Jaringan membagi gambar menjadi semacam kotak dan memprediksi kotak pembatas (parallelepipeds, bounding objects found) dan probabilitas bahwa ada objek yang diinginkan untuk setiap area.



Keuntungan dari pendekatan ini adalah bahwa ketika melihat seluruh gambar, YOLO memperhitungkan konteks gambar ketika mendeteksi dan mengenali suatu objek. Selain itu, YOLO memiliki keunggulan yang jelas dalam kinerja: ia seribu kali lebih cepat dari R-CNN dan beberapa ratus kali lebih cepat dari Fast R-CNN.







Contoh operasi YOLO ditunjukkan pada Gambar 3. Analisis gambar dilakukan bingkai demi bingkai, semua lampu lalu lintas merah yang ditemukan terdeteksi dengan benar oleh jaringan saraf.



Pelatihan dua jaringan saraf keseluruhan membutuhkan komputer yang cukup kuat, terutama dalam hal kartu video Perhitungan GPU digunakan. Kami menggunakan prosesor Core i7 generasi kedelapan, kartu grafis nvidia gtx1080 dan RAM 32GB. Karakteristik sistem seperti itu sudah cukup untuk implementasi proyek.



Berdasarkan hasil menggunakan model untuk mendeteksi pelanggaran lalu lintas, kita dapat mengatakan bahwa itu adalah proyek yang sukses. Input ke skrip adalah video dari perekam otomatis selama satu bulan dengan total durasi 7 jam 11 menit, waktu penarikan model (pemrosesan video yang masuk) adalah 25 menit. Pada akhir pemrosesan semua file video, 112 fragmen masing-masing 8 detik (total 15 menit) dipotong, yang hampir 7 jam disimpan, pelanggaran mudah diidentifikasi.

Anda dapat mengirim pertanyaan Anda ke alamat email .



All Articles