Saat kami mendesain ulang kursus Pembelajaran Mendalam kami pada akhir tahun lalu untuk membuatnya lebih visual dan berbasis kasus dari praktik bisnis nyata, kami menyertakan modul baru tentang markup data di platform kerumunan Yandex.Toloka.
Tapi karena crowdsourcing bukan satu-satunya cara untuk markup, kami telah mempersiapkan terjemahan artikel ini dari blog Lionbridge untuk siswa baru dengan ikhtisar tentang pendekatan utama markup data. Kami harap Anda juga merasakan manfaatnya.
Kualitas project machine learning secara langsung bergantung pada cara Anda mendekati solusi dari 3 tugas utama: pengumpulan data, preprocessing, dan markupnya.
Markup biasanya merupakan proses yang kompleks dan memakan waktu. Misalnya, sistem pengenalan gambar sering kali harus menggambar kotak pembatas di sekitar objek, sementara bekerja dengan sistem rekomendasi produk dan sistem analisis ucapan mungkin memerlukan pengetahuan tentang konteks budaya. Jangan lupa juga bahwa sebuah data array bisa berisi puluhan atau lebih ribuan sample yang butuh markup.
, , . , 5 .
:
In-house: , . : . , , , -.
: , . ., . , , . , ; , . , , .
: โ . - , . , , . , , .
: , , . - (GAN). GAN ( ), . - . GAN . . , , , .
ยซ ยป: . , , . , , , . , , .
:
| ||
In-house |
|
|
|
|
, |
|
| |
, |
|
|
|
|
|
|
|
|
. : , , , . .
-------------
Deep Learning 6.0 Newprolab 9 .
- Deep Learning 7.0 - c 30 22 2021 .