Kami terus mengumpulkan materi untuk Anda dari area ML. Seperti biasa, kami memberikan preferensi pada proyek yang berisi tautan ke repositori yang tidak kosong, atau menyediakan API tingkat tinggi.
Iris
MediaPipe, sebuah perusahaan yang berspesialisasi dalam solusi ML open source untuk mengenali objek di luar angkasa - seperti FaceMesh dan Handpose, yang menjadi dasar kami mengumpulkan demo - mempresentasikan alat baru Iris . Seperti namanya, model pembelajaran mesin ini mengenali iris, pupil, dan kontur mata menggunakan kamera RGB sederhana secara real time. Dengan kesalahan kurang dari 10%, itu juga menentukan jarak antara subjek dan kamera tanpa sensor kedalaman. Sayangnya, sejauh ini algoritme tidak dapat menentukan ke arah mana seseorang sedang melihat, sama seperti algoritme tersebut tidak dapat mengidentifikasi seseorang, tetapi dalam kombinasi dengan Pose Animator, algoritme ini memungkinkan Anda untuk membuat lebih banyak karakter animasi "hidup", jadi kami menunggu tren untuk topeng kartun.
FMKit
Tidak hanya Mediapipe yang mencoba memecahkan masalah peralatan periferal yang mahal menggunakan algoritme pembelajaran mesin - para peneliti dari Universitas Arizona telah mengembangkan cara untuk berinteraksi dengan lingkungan VR atau AR tanpa pengontrol khusus.
Algoritme mereka mengenali kata-kata yang ditulis di udara dengan jari Anda. Tidak mungkin dilakukan tanpa perangkat input sama sekali; pengembang menggunakan sensor penangkapan gerak Leap Motion. GitHub dengan kode sumber dan kumpulan data FMKit. Peneliti
Gaya dan Semantik
di Swiss Higher Technical School of Zurich telah mengembangkan jaringan saraf terbukayang memungkinkan Anda untuk memanipulasi gambar yang dihasilkan dengan atribut tingkat tinggi dan deskripsi teks. Pada input model, Anda dapat memberikan topeng objek dengan kelasnya. Jaringan saraf akan membuat gambar yang memiliki struktur serupa. Anda dapat mengedit konten gambar menggunakan kueri teks. Model tersebut bekerja dalam dua tahap. Pada yang pertama, latar belakang gambar dibuat, yang kedua - generator mensintesis latar depan gambar dengan mempertimbangkan latar belakang yang dibuat. Ini memecahkan masalah artefak yang muncul di latar belakang saat menghapus atau memindahkan gambar dari latar depan.
Reaktor Semantik
Jika Anda membuat aplikasi berbasis bahasa, seperti chatbot layanan pelanggan atau game pencarian, Anda mungkin tertarik dengan alat ini. Semantic Reactor adalah plugin Google Sheets yang memungkinkan Anda menjalankan model pemahaman bahasa alami pada data Anda sendiri. Game browser ini menunjukkan kemampuan alat tersebut. Untungnya, ini juga mendukung model multibahasa yang dilatih pada 16 pasangan, termasuk bahasa Rusia.
Fawkes
Pembelajaran mesin menimbulkan banyak kontroversi etika yang dapat diselesaikan ... pembelajaran mesin yang sama. Para peneliti di University of Chicago telah mengembangkan algoritme yang membuat perubahan tingkat piksel tidak terlihat oleh mata manusia dalam foto sehingga tidak dapat digunakan untuk model lain. Mereka menyebutnya proses image masking. Mereka menamai instrumen itu untuk menghormati Guy Fawkes, yang dikenal semua orang berkat topeng anonimnya. Pembuatnya mengklaim bahwa foto yang disamarkan dapat diposting di jejaring sosial, dan jika foto tersebut digunakan untuk melatih model pengenalan wajah, maka masking tidak akan memungkinkan model untuk mengenali Anda dalam gambar karena distorsi. Seperti yang mereka katakan, baji.
Lihat & Semprotkan
Studi kasus pembelajaran mesin di industri pertanian. John Deere, produsen peralatan pertanian terbesar di dunia, telah beralih ke pembelajaran mesin dan visi komputer untuk mengendalikan gulma dengan lebih baik. Jaringan saraf mengidentifikasi gulma dari gambar, dan kemudian langsung menyemprotnya dengan herbisida. Ini menghemat sumber daya tanpa merusak tanaman. Kerangka PyTorch digunakan untuk melatih semua model. Kesulitan pertama yang dihadapi oleh pencipta adalah persiapan dan pelabelan dataset, karena kesamaan eksternal antara gulma dengan tanaman lain. Menerapkan model pada perangkat juga sulit, karena robot harus cepat membuat keputusan dan bergerak di sekitar lapangan.
Ekonom AI
Perkembangan kebijakan ekonomi dan penilaian keefektifannya tidak dapat mengimbangi perubahan di dunia sekitar, seperti misalnya, terlihat dengan latar belakang pandemi global. Selain itu, model ekonomi memerlukan banyak asumsi, yang membatasi kemampuannya untuk sepenuhnya menggambarkan kondisi ekonomi saat ini: misalnya, model dapat mempelajari pajak penghasilan secara terpisah, tetapi mengecualikan pajak konsumsi.
Salesforce mengusulkan algoritme ML untuk memecahkan masalah ini dan telah menerbitkan kerangka kerja yang menggunakan pembelajaran penguatan dan pemodelan ekonomi untuk merancang dan mengevaluasi kebijakan ekonomi baru dengan cepat berdasarkan data.
ScaNN
Tidaklah sulit untuk mencari bahkan database artikel yang besar menggunakan kueri yang membutuhkan pencocokan tepat dari judul atau penulis, karena parameter seperti itu mudah diindeks. Dalam kasus kueri yang lebih abstrak, Anda tidak dapat lagi mengandalkan metrik kemiripan, seperti jumlah kata umum di antara dua frasa. Misalnya, kueri "fiksi ilmiah" lebih banyak tentang "masa depan" daripada "sains", meskipun kueri kedua memiliki satu kata yang cocok dengan kueri tersebut.
Model pembelajaran mesin sangat baik dalam memahami bahasa dan dapat mengubah masukan menjadi embeddings, representasi vektor dari kata-kata yang dilatih untuk menggabungkan masukan yang serupa ke dalam kelompok. Google telah memperkenalkan alat pencarian kesamaan open source untuk vektor semacam itu.
Merender ulang orang dari satu gambar
Merender ulang seseorang berdasarkan satu gambar adalah tugas yang sulit. Algoritme modern sering kali membuat artefak seperti distorsi yang tidak realistis pada bagian tubuh dan pakaian.
Studi ini menunjukkan algoritme baru yang memungkinkan orang berganti pakaian baru melalui rendering ulang tekstur. Ini menyajikan postur dan bentuk tubuh dalam kisi parametrik yang dapat direkonstruksi dari satu gambar dan mudah dimodifikasi. Alih-alih peta UV berwarna, pencipta menyarankan untuk menggunakan peta atribut untuk menyandikan tampilan. Selama ini kualitasnya masih lemah dan tidak ada sumbernya, tapi sudah bisa dibayangkan bagaimana teknologi ini akan segera diterapkan di Ecommerce.
Bonus: pada bulan Mei kami memberi tahutentang algoritme yang menentukan kedalaman bingkai dalam video, tetapi kemudian dimungkinkan untuk mengevaluasi hanya demonstrasi video, sekarang kode sumber proyek telah tersedia .
Sekian terima kasih atas perhatiannya!