Seperti yang Anda ketahui, kami selalu menyertakan publikasi paling menarik tentang topik pembelajaran mesin dalam koleksi, dan prioritas diberikan pada proyek dengan repositori yang tidak kosong. Jadi, Februari menyenangkan saya dengan sejumlah layanan dalam hal ini, jadi mari kita mulai dengan mereka. Pergilah:
Makalah dengan Kumpulan Data dan Perpustakaan
Ada semacam sumber daya Papers with Code, yang misinya terkait langsung dengan namanya - untuk mengumpulkan publikasi dari bidang pembelajaran mesin yang memiliki kode, serta memberikan kesempatan untuk menawarkan penerapannya sendiri.
Bulan ini, mereka meluncurkan bagian Kumpulan Data yang Tersedia, yang telah mengindeks lebih dari 3.000 kumpulan data penelitian. Di katalog, Anda dapat mencari kumpulan data berdasarkan frekuensi penyebutan, cakupan, tipe data, dan bahasa yang didukung.
Mereka juga menambahkan kemampuan untuk mencari model klasifikasi gambar yang sudah dilatih sebelumnya yang dapat disesuaikan dengan set data Anda sendiri. Saat ini sudah ada 300+, dan katalog akan terus bertambah.
Google Model Search
Aksesibilitas: halaman proyek , repositori
Keberhasilan jaringan saraf sering kali bergantung pada seberapa luas jaringan tersebut dapat diterapkan ke berbagai tugas. Saat membuat model, Anda harus membuat sejumlah keputusan arsitektur yang kompleks - seberapa dalam jaringan saraf seharusnya, jenis lapisan apa yang digunakan di dalamnya, dll.
Google telah menghadirkan platform yang akan membantu Anda menemukan arsitektur yang tepat untuk set data dan tugas Anda, yang akan mengurangi waktu konfigurasi dan pengkodean dan membutuhkan lebih sedikit sumber daya komputasi.
Library ini memungkinkan Anda menjalankan algoritme di luar kotak pada data Anda - apa pun area subjeknya, secara otomatis memilih arsitektur yang optimal, memperbaiki ansambel model, atau model suling.
ZenML
Aksesibilitas: kerangka kerja MLOps situs / repositori
proyek yang menyederhanakan transfer jalur pipa dari laptop ke lingkungan produksi. Reproduksibilitas terjamin eksperimen pelatihan karena pembuatan versi data, kode, dan model. Platform ini juga memungkinkan Anda beralih dengan cepat antara lingkungan lokal dan cloud, menyediakan penolong siap pakai untuk membandingkan dan memvisualisasikan parameter dan hasil, menyimpan status pipeline untuk iterasi cepat, dan banyak lagi.
TensorFlow 3D
Aksesibilitas: Artikel / Repositori
Dengan semakin banyaknya perangkat yang menangkap data 3D, seperti lidar dan kamera kedalaman, kebutuhan akan teknologi untuk memproses data ini dan memahami pemandangan 3D semakin meningkat. Ini diperlukan untuk menavigasi dan bekerja di dunia nyata mobil dan robot yang dapat mengemudi sendiri, serta untuk meningkatkan teknologi AR.
Google meluncurkan pustaka modular untuk menerapkan pembelajaran mendalam ke data 3D di TensorFlow. Ini berisi jalur pelatihan dan penilaian untuk segmentasi semantik 3D, klasifikasi pemandangan, deteksi objek 3D, dan banyak lagi.
MeInGame
Ketersediaan: artikel / repositori
Dalam game komputer, sering kali terdapat editor karakter yang memungkinkan Anda untuk mengubah tampilan pemain menggunakan pengaturan berbagai parameter. Algoritme MeInGame memungkinkan Anda membuat karakter khusus hanya dengan satu foto. Jaringan saraf memprediksi bentuk wajah dan teksturnya. Meskipun metode berdasarkan 3D Morphable Face Model (3DMM) dapat menghasilkan potret 3D dari setiap gambar, topologi mesh biasanya berbeda dari yang digunakan di kebanyakan game. Penulis algoritme ini mengklaim telah memecahkan masalah ini.
SAM
Aksesibilitas: artikel / gudang
Menyimulasikan penuaan dari satu foto wajah sangatlah sulit, karena diperlukan untuk mensimulasikan perubahan fitur wajah tertentu dan bahkan bentuk kepala, dengan tetap mempertahankan identitas orang tersebut.
Secara internal, StyleGAN digunakan, tetapi di sini para peneliti juga menggunakan jaringan regresi usia yang sudah dilatih sebelumnya yang digunakan pembuat enkode untuk menghasilkan kode tersembunyi yang sesuai dengan usia target. Metode ini memperlakukan proses penuaan berkelanjutan sebagai masalah regresi antara usia masukan dan usia target, memberikan kontrol yang tepat atas gambar yang dihasilkan. Model ini memungkinkan Anda untuk mengedit gambar yang dihasilkan.
MODE
Ketersediaan: halaman proyek / demo interaktif
Kasus aplikasi StyleGAN baru untuk pemasangan pakaian virtual. Algoritme mentransfer pakaian dari foto satu orang ke foto seseorang, yang dikirimkan ke pintu masuk. Metode ini didasarkan pada interpolasi ruang tersembunyi, dengan mempertimbangkan pose StyleGAN2, yang sesuai dengan bentuk tubuh, rambut, warna kulit orang yang dituju. Algoritme tersebut memungkinkan pakaian untuk berubah bentuk sesuai dengan bentuk tubuh tertentu, dengan tetap mempertahankan pola dan detail bahannya. Outputnya adalah gambar fotorealistik dengan resolusi 512x512 yang layak.
NeRViS
Aksesibilitas: Halaman / Repositori Proyek
Teknik stabilisasi video yang ada dapat memotong batas bingkai secara parah atau membuat artefak dan distorsi.
Awal algoritma ini memperkirakan bidang deformasi padat dan menggunakan bingkai yang berdekatan untuk mensintesis bingkai stabil lengkap. Kebaruan dari pendekatan ini adalah sintesis spasial hibrida berbasis pembelajaran, yang menghilangkan artefak yang disebabkan oleh aliran optik yang tidak akurat dan objek yang bergerak cepat.
Sintesis Tampilan Stabil
Ketersediaan: artikel / repositori
Berdasarkan sekumpulan foto yang menggambarkan pemandangan dari sudut pandang yang didistribusikan secara bebas, algoritme mensintesis pemandangan baru. Metode ini bekerja pada perancah geometris, yang dihitung berdasarkan fotogrametri SfM. Tampilan target diberikan oleh jaringan konvolusional dari tensor karakteristik yang disintesis untuk semua piksel.
Artikel itu diterbitkan kembali pada November tahun lalu, tetapi kodenya baru tersedia sekarang.
JigsawGan
Aksesibilitas: artikel
Jaringan saraf yang diawasi sendiri secara generatif yang dilatih untuk memecahkan teka-teki. Sebagai masukan, model menerima bagian gambar yang ditempatkan secara acak dan tanpa perintah mengembalikan gambar asli darinya, yaitu, model tidak mengetahui gambar aslinya.
CharacterGAN
Ketersediaan: artikel / repositori
Jaringan saraf generatif, yang dapat dilatih hanya pada beberapa gambar karakter dalam pose berbeda, untuk menghasilkan pose baru berdasarkan lokasi poin utama. Ini memungkinkan Anda untuk menganimasikan gambar statis. Kebaruan dari pendekatan ini adalah bahwa gambar dibagi menjadi beberapa lapisan, yang masing-masing diproses secara terpisah. Ini memecahkan masalah penghalang ketika benda asing muncul ke depan. Untuk kenyamanan, GUI telah ditambahkan yang memungkinkan Anda menyesuaikan pose secara manual berdasarkan poin-poin penting.
VAE diskrit
Aksesibilitas: Gudang
Di edisi terakhir, kami berbicara tentang DALL-E yang menakjubkan. Pada akhir Februari, OpenAI membuat repositori dengan nama model, tetapi model itu sendiri belum dirilis - di dalam hanya sebagian dari model, yaitu paket PyTorch untuk VAE diskrit. Ini adalah autoencoder variasional yang, dalam kasus kami, menghasilkan gambar dari deskripsi tekstual.
Nostalgia yang dalam
Ketersediaan: layanan online
Dan akhirnya, selalu menyenangkan bila produk yang sederhana dan mudah dipahami dibuat berdasarkan model. Jadi, perusahaan MyHeritage, yang menangani masalah silsilah dan silsilah, tampaknya menggunakan algoritme Model Orde Pertama, mengacaukan antarmuka pengguna yang mudah digunakan, dan membuat layanan untuk "menganimasikan" foto.
Hasilnya adalah banyak konten khusus yang dihasilkan dan jangkauan viral yang sangat besar. Mereka juga mengatakan bahwa bisnis AI tidak berguna.
Sekian, terima kasih atas perhatiannya dan sampai jumpa sebulan lagi!