Dari mana asal aplikasi ML di Rusia di tingkat negara bagian?

Kata pengantar



Halo!



Pertanyaan dalam judul bukanlah retorika, saya sangat tertarik. Jika tiba-tiba ada yang tahu jawabannya, silahkan tulis di komentar, mungkin saya mencoba dari sisi yang salah.



Saya juga mengklarifikasi bahwa saya tidak punya tujuan untuk mengeluh tentang seseorang, oleh karena itu, dalam tanggapan dari kementerian, saya menghapus semua perangko dengan nama dan tanda tangan pejabat yang bertanggung jawab. Saya tertarik untuk memahami bagaimana sistem ini bekerja.



Bagaimana semuanya dimulai?



Semuanya dimulai dengan fakta bahwa pada akhir 2019 saya menyadari bahwa di bidang aktivitas profesional saya sebelumnya, saya telah mencapai puncak tertentu dan pengembangan lebih lanjut di bidang ini untuk saya:



  1. tidak tertarik
  2. itu mungkin, tetapi sepenuhnya sesuai dengan prinsip Pareto, di mana saya harus menghabiskan banyak upaya demi prospek yang mengerikan, dan bahkan tidak semenarik yang terlihat bagi saya di awal perjalanan.


Berkat satu pertemuan penting dengan teman-teman, saya menyadari bahwa keinginan lama, tenggelam karena berbagai alasan, adalah "pergi ke IT", yaitu di ML dan secara khusus saya bisa sukses. Saya tidak akan menjelaskan bagaimana saya belajar, tetapi itu benar-benar intens, produktif dan yang terpenting mengasyikkan, sedemikian rupa sehingga saya harus memaksakan diri untuk beristirahat. Pada akhirnya, saya bangkrut. Dia berhenti dari pekerjaan lamanya dan mencurahkan hampir seluruh waktu luangnya untuk belajar.



Seiring waktu, saya mulai berpikir untuk mencari pekerjaan di bisnis favorit baru, tetapi kisah tentang Covid dimulai. Bukan rahasia lagi bahwa pembelajaran mesin baru-baru ini menjadi topik yang sangat populer dan sebagai hasilnya, sejumlah besar pelamar untuk posisi junior / trainee di bidang DS telah muncul di pasar tenaga kerja. Secara keseluruhan, 2 faktor ini, bagi saya pribadi, berarti bahwa meskipun dengan hasil yang baik di beberapa kompetensi untuk pemberi kerja, saya hanyalah salah satu dari banyak pendatang baru di bidang ini, sama seperti saya, dan saya memiliki sedikit peluang bahkan untuk mencapai tahap wawancara.



Setelah memikirkannya dan menyadari bahwa satu-satunya cara agar saya dapat membedakan diri saya dengan baik dari yang lain adalah adanya proyek yang bagus, saya mulai mencari topik untuk proyek pertama. Ketika saya baru mulai belajar ML, saya penuh dengan jumlah ide, tetapi pada saat saya memilih topik proyek, ide-ide ini menjadi lebih sedikit, karena sudah mempelajari sedikit lebih spesifik, saya mulai berpikir sedikit berbeda - “ya, ini ide yang bagus, tetapi CV terbuka tidak cocok karena pelatihan pendahuluan dan untuk mengajar saya sendiri, saya tidak akan memiliki cukup sumber daya dan data, hanya jika Anda tidak mengambil jaringan GAN dan menghasilkan gambar dengan bantuannya. Dan kemudian ada pembatasan permintaan ke versi gratis dari API, dan untuk membongkar kumpulan data normal, Anda memerlukan banyak waktu atau uang "dan seterusnya.



Memutuskan untuk pergi dari ujung yang lain, saya kembali ke Kaggle, membuka kumpulan data, memberi peringkat berdasarkan "hotness" dan kemudian saya sadar. Covid ada di halaman! Apa yang bisa lebih baik - untuk membuat bukan hanya proyek, tetapi proyek dengan topik hype! Kemudian mereka mungkin akan memperhatikan saya dan merobek saya dengan tangan mereka. Jadi saya pikir kemudian. Ya, schazz.



Ke depan, saya tidak bisa tidak mencatat bahwa meskipun saya kecil, tetapi memiliki kelebihan, tanggapan saya terhadap xx diabaikan secara terbuka atau ditolak dengan sopan, bahkan untuk lowongan-lowongan yang saya rekomendasikan oleh karyawan internal perusahaan. Hanya dalam sebulan mencari kerja, ada sekitar 70 tanggapan dari pihak saya, dan sepertinya 3 wawancara setelah itu saya sendiri membuat keputusan negatif. Saya tidak tahu persis apa yang terjadi pada masing-masing kasus, tetapi saya curiga bahwa masalahnya adalah pada usia (30+), kurangnya pendidikan / pengalaman khusus dan proyek yang bengkok.



Tapi secara khusus, kisah pencarian kerja ini dengan akhir yang bagus - manajer saya saat ini menemukan saya di xx sendiri, saya dengan cepat melalui tahapan wawancara dan sekarang saya melakukan analitik, termasuk menggunakan ML, dan saya sangat menyukainya. Selain itu, mereka membayar saya untuk itu! Saya mungkin tidak akan mengatakan ini di depan wajah pemimpin saya karena introversi tertentu saya, tapi terima kasih banyak jika Anda tiba-tiba membaca ini)



Baiklah, saya terlalu terbawa ke arah lirik. Lebih dekat



Untuk bisnis



Setelah mendapatkan semuanya di dataset caggle yang sama (https://www.kaggle.com/parthachakraborty/pneumonia-chest-x-ray), saya menulis jaringan sekuensial kecil dengan akurasi sekitar 85%. Alhasil, saya mengambil dataset dengan pneumonia secara keseluruhan, dan bukan pneumonia yang disebabkan oleh Covid, karena saya tidak menemukan set dengan jumlah foto yang signifikan dari COVID-19, tetapi saat itu saya hanya tahu sedikit tentang metode augmentasi.



Untungnya, saya ingat bahwa saya memiliki seorang teman, seorang ahli radiologi, dengan bantuannya saya mempelajari beberapa detail tentang perbedaan diagnosis pneumonia dengan metode CT scan dan sinar-X. Saya juga mengiriminya gambar yang diklasifikasikan menurut model, yang saya ambil dari luasnya sarang laba-laba atas permintaan "sinar-X paru-paru yang terinfeksi pneumonia." Hasilnya sedikit lebih buruk dari yang saya harapkan. Jadi, dalam beberapa foto yang dianggap jaringan sebagai pneumonia bakterial, sebenarnya ada tuberkulosis, yang tidak ada dalam sampel pelatihan, tetapi sebaliknya persentase kesalahan sesuai dengan skor model (X_valid, y_valid).



Saya sangat gembira. Namun, saya melakukan ilmu data yang sebenarnya, dan tidak melakukan pengiriman ke-70 dalam upaya untuk masuk ke 1% teratas, memprediksi harga di Melbourne. Saya tidak akan terkejut jika saya mengetahui bahwa makelar lokal mendapatkan cegukan ketika mereka mencoba mengevaluasi sebuah rumah. Maaf, saya tidak bisa menahan.



Secara umum, saya terinspirasi, mengirimkan lusinan tanggapan baru dan ... sekali lagi tidak ada.



Ketika ide ini muncul di benak saya, saya tidak dapat mengatakan bahwa saya secara eksklusif dibimbing oleh niat baik seperti damai-damai, menyelamatkan orang miskin dan lain-lain. Tidak, tujuan saya adalah untuk mencari pekerjaan secepat mungkin, dan untuk ini saya harus menonjol secara positif dari kelompok “Saya ingin berada di ML” yang sama.



Tetapi pada saat yang sama, melalui krisis remaja "mengapa kita ada di sini?" Dan sebagai seorang ateis, saya memutuskan untuk diri saya sendiri kredo saya - bahwa saya ingin membuat dunia menjadi tempat yang lebih baik, karena selebihnya, menurut pemahaman saya, tidak memiliki nilai riil dalam skala besar. Idealis dan naif? Ya, ini benar dan apa yang saya lakukan dan mengapa saya menulis posting ini sama sekali mengikuti kualitas saya ini.



Saya memutuskan untuk menulis kepada resepsi Presiden Federasi Rusia sebuah proposal kira-kira dengan karakter berikut (saya belum menyimpan teks persisnya, karena ditulis dalam bentuk khusus di situs web resepsi): “Saya, ini dan itu, dalam kerangka kerja Presiden Federasi Rusia menunjuk area-area utama perkembangan negara, yaitu, dalam kerangka penerapan ML di berbagai bidang negara, saya mengusulkan yang berikut: mengatur pengumpulan dan penyimpanan gambar sinar-X, dan membuat penyimpanan ini dapat diakses untuk diproses dengan metode ML dan kemungkinan memberikan umpan balik. " Kemudian saya menjelaskan secara singkat model saya, menunjukkan bahwa bahkan saya, dengan sedikit pengetahuan saya, dapat membuat model rekomendasi yang dapat bekerja bersama-sama dengan ahli radiologi dan berguna. Dan di Rusia ada banyak penggemar DC dengan tingkat pengetahuan / keterampilan tinggi yang dapat melakukan banyak hal tidak hanya di bidang kedokteran,tapi juga di area lain di mana pada prinsipnya Anda bisa menerapkan ML.



Sayangnya, saya tidak ingat secara persis teks pengajuan banding, karena itu pada bulan Maret atau April, tetapi arti umumnya persis sama.



Mengembangkan topik ini, sekarang saya akan menambahkan bahwa, pada prinsipnya, perlu untuk mengumpulkan dan mengumpulkan sebanyak mungkin data terbuka dan meluncurkannya ke analog dari Kaggle di mana juga dimungkinkan untuk mengatur tugas, mendiskusikan solusi mereka dan menemukan yang terbaik. Rosstat sudah melakukan hal serupa terkait publikasi data, bahkan saya berhasil menganalisis sesuatu, namun topik ini perlu dikembangkan lebih lanjut.



Pesan itu terdaftar, tentang mana surat terpisah datang, tetapi saya masih cukup terkejut ketika saya melihat jawabannya datang. Tanggapan pertama datang dari Kementerian Kesehatan. Itu pendek dan singkat.







Inti dari jawabannya, menurut saya, adalah "ok, terima kasih, jangan."



Saya kira ini adalah akhir dari cerita, tetapi jawaban lain datang dari Kementerian Perindustrian dan Perdagangan. Jawabannya sangat mendetail dan mendetail, tetapi saya merasa mereka diberi informasi yang menyimpang, atau mereka salah paham.



















Saya tidak meminta bantuan dana apapun untuk pelaksanaan proyek ini, terlebih lagi saya tidak menulis sepatah kata pun yang ingin saya ikuti (walaupun secara alami saya tidak akan menolak). Ya, mereka menjawab, ya, dan terima kasih untuk itu.



Saya akan melupakan cerita ini dengan aman jika saya tidak secara teratur menemukan berita seperti ini atau ini (sangat segar) atau terutama yang ini . Setelah membacanya, saya tertawa kecil, karena inilah yang saya tulis.



Hasil



Fuh, nah, postingannya sudah keluar.



Ini adalah pertanyaan kunci yang ingin saya tanyakan.



Siapa yang terlibat dalam penerapan ML dalam "proses bisnis" negara? Siapa yang memimpin orang-orang ini?



Apakah terpusat atau apakah setiap kementerian memiliki ilmuwan datanya sendiri? Apakah mereka bahkan di aparatur negara?



Saya melihat teks strategi nasional pengembangan kecerdasan buatan untuk periode hingga 2030, tapi saya masih punya belasan pertanyaan, siapa yang bisa saya tanyakan? Untuk mendapatkan jawaban yang masuk akal, tentunya.



Mempertimbangkan jawaban yang saya terima, saya memiliki beberapa keraguan bahwa strategi ini bukan hanya pernyataan niat, tetapi rencana nyata, dan bahwa seluruh usaha ini tidak akan menghasilkan pembiayaan untuk beberapa proyek hewan peliharaan "sendiri", yang kemudian akan dirujuk, mencatat keberhasilan strategi.



Secara umum, ada dari mereka yang membaca posting ini yang menerapkan program apapun dari strategi ini?



Terima kasih semua telah meluangkan waktu n menit Anda!



All Articles