Tingkat kematangan proses ML (proses terkait Pembelajaran Mesin)

Pembelajaran mesin berada di luar zona sensasi. Dan sulit untuk mengatakan dengan jelas seberapa baik atau buruk hal itu, tetapi yang sangat jelas - semakin banyak orang yang mengajukan pertanyaan "di mana uangnya?" Mengenai proyek ML. Dan artikel ini tidak akan terkecuali - hype sudah berakhir, kita harus bekerja.





Jika kita berbicara tentang membangun proses apa pun, maka secara pribadi saya sangat suka menggunakan istilah "tingkat kedewasaan". Lagi pula, jika Anda memiliki skala penilaian yang dapat dimengerti di depan mata Anda, Anda selalu dapat memahami di mana Anda berada, apa yang menanti Anda di depan, Anda dapat memutuskan prioritas dan mulai menyesuaikan apa yang Anda butuhkan di sini dan sekarang, dan tidak melompati pasangan tingkat dan membuat revolusi, menemukan kembali roda dalam tawar-menawar ... dan itu mungkin tidak berguna nanti. Secara umum, latihan yang bermanfaat dari semua sudut pandang.





Secara teoritis murni, Anda dapat mengambil tingkat kematangan proses standar yang dijelaskan dalam CMMI, ISO / IEC 33001 atau deskripsi IT yang lebih membumi dari ITIL dan menggesernya ke ML. Saya mencoba beberapa kali untuk melakukan latihan ini dalam praktik, tetapi ternyata itu adalah semacam kuda bola dalam ruang hampa, yang dapat dan memberikan jawaban atas pertanyaan apa adanya dan yang akan terjadi, tetapi sulit untuk menggambar jalan yang bisa dimengerti. Oleh karena itu, melihat-lihat, saya memutuskan untuk mengingat dan mensistematisasikan jalan saya yang sulit dalam mengerjakan berbagai proyek ML, karena CMMI itu bagus, tetapi untuk pekerjaan nyata Anda membutuhkan sesuatu yang lebih spesifik dan membumi. Secara umum, sebagai hasilnya, deskripsi dari beberapa tahap dasar pengembangan pekerjaan pada proyek ML lahir. Apakah bisa disebut sebagai “tingkat kedewasaan” atau tidak adalah pertanyaan kedua, tetapi pertanyaan di atas sudah terjawab dan ini adalah hal yang paling penting.





Jadi, mari kita membahas secara spesifik. Mungkin satu-satunya level di mana saya tidak menemukan sesuatu yang baru dan mengambilnya dari ITIL adalah level "0" atau "tidak ada". Seperti yang mereka katakan, jika tidak ada proses, maka tidak dalam bentuk apapun, baik itu tentang IT atau tentang ML. Tapi serius, 5 level / langkah saya adalah sebagai berikut:





  • Level 1. "Penggemar"





  • Level 2. "R&D"





  • Level 3. "Analisis"





  • Level 4. "Keahlian"





  • Level 5 "Otomatiskan"





Tingkat 1 "Penggemar"

- ( ) . , ( ), , , , «Big Data» . Python ( R Matlab … ) -- - . .





— , . , .





2 «»

- , , , . , :





  • – -, .., .





  • – . - 80% , .





  • ML . — , . .





3 « »

, , , . :





  • . ( , ), . , .





  • , .. -. , . . , .





  • . , — , ?





4. «»

, ( , ..), - . , :





  • - PROD- DEV/TEST/PROD





  • , .. – , .





  • – - , - . Run the business/Change the business.





5 « »

, 4- . DataOps&MLops . DVC Feature Store . .





, :











1





2





3





4





5









.





.















.

























.





















100%









PC/ ( +GPU)





PC ( on-prem)





ML- .









PROD DEV/TEST .





.





PROD DEV/TEST .





.









1-2 (Data Scientists - DS)





3-5 :2-3 DS





1-2 DE (Data Engineers)





5-10 :





3-6 DS





2-4 DE











10+ .





«ML-ops».









25+









-





1-2





2-4





5+





10+





50+









( , ). , , . , , .





, , :





  • , ML? ?





  • ?





  • , ?





, ML - , — .





— ( ) . , ML — Python, R, Azure ML Studio, SPSS SAS, . 1- 5- . . . , ( ), , .





Namun pada kenyataannya, ini adalah topik tersendiri untuk diskusi (atau artikel lain, jika ada inspirasi) - pilihan jalur yang optimal dari satu level ke level lainnya dan apa itu tergantung, kapan dan software apa yang dibutuhkan, keahlian apa yang dibutuhkan , dan di mana tempat untuk outsourcing dan tentu saja - tapi bagaimana menentukan titik, kapan harus berhenti.








All Articles