Pengembangan produk AI berdasarkan visi mesin. Retrospektif menengah: pikiran, rasa sakit, penderitaan

Halo para pembaca. Saya sudah mencoba untuk menulis artikel ini beberapa kali, tetapi setiap kali saya menundanya, karena memikirkan perlunya melakukan perenungan yang mendalam atas akumulasi pengalaman, saya diliputi dengan keputusasaan dan kesedihan. Namun, saya telah memperkuat niat saya untuk melakukannya untuk berbagi pengalaman saya dengan Anda yang berencana melakukan hal serupa di bidang AI. Semua hal berikut berlaku untuk area aktivitas yang sangat spesifik: AI dalam hal computer vision.



Penafian : Saya bukan ahli dalam jaringan saraf, tetapi saya memainkan peran sebagai pemilik produk di mana model jaringan saraf dari visi komputer memainkan peran kunci. Artikel ini ditujukan bagi mereka yang terpaksa melakukan pekerjaan yang sama, serta untuk para spesialis ML yang ingin memahami bagaimana orang memandang aktivitas mereka dari sisi bisnis.



Jadi, kami membuat produk berdasarkan computer vision, termasuk deteksi, pelacakan, identifikasi, identifikasi ulang orang, penentuan jenis kelamin dan usia.



Berbagai project sudah kami kerjakan sejak lama, termasuk yang berelemen ML, namun baru kali ini kami mengerjakan project yang bagian ini sentralnya. Selama ini, sebagai product owner, saya belajar banyak hal baru dan aneh serta merumuskan beberapa prinsip yang penting untuk mencapai kesuksesan dalam menciptakan produk semacam itu.



Risiko dalam produk AI



Risikonya sangat besar. Sebenarnya, pembuatan produk AI sebenarnya berakhir ketika semua risiko sudah dihilangkan. Jika, dalam kasus membuat produk menggunakan algoritme klasik, Anda menghabiskan 5 hingga 20% waktu Anda bekerja dengan risiko, maka, dalam kasus produk AI, proses pembuatan produk itu sendiri adalah perang melawan risiko. Saya memperkirakan jumlah waktu yang dihabiskan untuk manajemen risiko hingga 90-95% dari waktu untuk membuat produk AI. Kesimpulan penting mengikuti dari pengamatan ini.



Untuk perusahaan grosir



Jadwal pengiriman, dan karena itu biaya, dengan tingkat kemungkinan yang tinggi, akan berulang kali gagal, itulah yang kami hadapi.



Risikonya sangat besar sehingga tidak masuk akal untuk melakukan sesuatu tentang produk sebelum bagian AI diselesaikan, diuji, dan dikirim.



Untuk kontraktor



AI- SMB / . "" Tinkoff, , . — .



, . , " , ".





AI Scrum , .



, , AI, Agile , , , "3 , 2 " .





. , , , .



:



: YOLOv4 – real-time Microsoft COCO



: Yolo4 Yolo3;

TL: , .

, Y3 Y4, .



.





ML, . : / , , , , .



. , . , , , , whatever. ML- , , , . .



, , , , . , , .



( ), ML . -, . , .





, — . .



, , , . , .



, Precision, Recall, F1, etc. .



, , 99.99% , , , , .



-



, . , — . , single shot .



. , realtime Yolo4. — 60 FPS Tesla T4. 416x416 , , FPS.



, Yolo4 , (FYI: ~ 15% ( 110 px 720p). , , . , . , .



: — . single shot ML — , .



- .



, :



  • ;
  • Yolo4 320x320, 416x416;
  • .


" , , , , 320x320, 416x416"?



, , :



  • ;
  • , ;
  • ;
  • , , ;
  • .


, , single shot -.





IT 15 , , . , ML, , : " , ".



, , , , .



, BigData Backend ML, .



, " " , . … - , , .



— .



, , , ML , , , .



— Terra Incognita



, Nvidia — Nvidia DeepStream . , DeepStream . Nvidia Inception, , - DeepStream, , .



" PyTorch" " DeepStream" , - C, Gstreamer, , , , TensorRT.



DeepStream — , Segmentation Fault, Python c NumPy, — - Gstreamer.



, Nvidia — . , — Nvidia, ML, .





ML- . , , -, etc. .



, , .





, WBS ML… ML- . , Trello -, ML- -.



:







, , WBS.





ML . — , . . " , ".



, :





, . , , .



ML- — , , , , , , , .




ML , , , , -, 23 , 14 16 , .



, . AI — , , - .




All Articles