Artikel yang Dipilih pada Pembelajaran Mesin: Kasus, Panduan, dan Penelitian - Juni 2020





Di sini Anda akan menemukan daftar materi yang dirilis pada bulan Juni dalam bahasa Inggris. Semuanya ditulis tanpa akademikisme berlebihan, berisi contoh kode dan tautan ke repositori yang tidak kosong. Sebagian besar teknologi yang disebutkan dalam domain publik dan tidak memerlukan perangkat keras tugas berat untuk pengujian.



Gambar GPT



Open AI memutuskan bahwa karena model transformator yang dilatih pada teks dapat menghasilkan kalimat lengkap yang koheren, jika model dilatih pada urutan piksel, maka dapat menghasilkan gambar yang diperbesar. Open AI menunjukkan bagaimana pengambilan sampel berkualitas tinggi dan klasifikasi gambar yang akurat memungkinkan model yang dihasilkan untuk bersaing dengan model konvolusional terbaik di lingkungan belajar yang tidak diawasi.







Depixelizer wajah



Sebulan yang lalu kami diberi kesempatan untuk bermain dengan alat ini, yang menggunakan model pembelajaran mesin untuk mengubah potret menjadi pixel art yang indah. Ini menyenangkan, tetapi sulit membayangkan penggunaan teknologi ini secara luas. Namun alat yang menghasilkan efek sebaliknya segera menjadi sangat diminati publik. Dengan bantuan depixelizer wajah, secara teori, akan mungkin untuk menetapkan identitas seseorang dengan merekam video dari kamera pengintai luar ruangan.





DeepFaceDrawing



Jika bekerja dengan gambar piksel tidak cukup, dan Anda perlu membuat foto dengan potret seseorang dari sketsa primitif, maka alat yang didasarkan pada DNN sudah muncul untuk ini. Seperti yang dikandung oleh pencipta, hanya garis besar umum yang diperlukan, dan bukan sketsa profesional - model kemudian akan dengan sendirinya mengembalikan wajah orang tersebut, yang akan bertepatan dengan sketsa. Sistem ini dibuat menggunakan kerangka kerja Jittor, seperti yang dijanjikan pembuatnya, kode sumber untuk Pytorch akan segera ditambahkan ke repositori proyek.







PIFuHD



Dengan perbaikan wajah, bagaimana dengan bagian tubuh lainnya? Berkat pengembangan DNN, dimungkinkan untuk memodelkan 3D sosok manusia berdasarkan foto dua dimensi. Keterbatasan utama adalah karena fakta bahwa prediksi yang akurat memerlukan analisis konteks yang lebih luas dan sumber data dalam resolusi tinggi. Arsitektur model yang berlapis dan kemampuan belajar ujung-ke-ujung akan membantu menyelesaikan masalah ini. Pada tingkat pertama, untuk menghemat sumber daya, seluruh gambar dianalisis dalam resolusi rendah. Konteks kemudian dibentuk, dan pada tingkat yang lebih rinci, model mengevaluasi geometri dengan menganalisis gambar resolusi tinggi.







RepNet



Banyak hal yang mengelilingi kita terdiri dari siklus frekuensi yang berbeda. Seringkali, untuk memahami esensi dari suatu fenomena, perlu untuk menganalisis informasi tentang manifestasinya yang berulang. Dengan mempertimbangkan kemungkinan pengambilan video, tidak lagi sulit untuk memperbaiki pengulangan, masalahnya adalah dalam menghitungnya. Metode perbandingan frame-by-frame dari kerapatan piksel dalam bingkai seringkali tidak cocok karena guncangan kamera, atau obstruksi oleh objek, serta perbedaan tajam dalam skala dan bentuk saat memperbesar dan memperkecil. Model yang dikembangkan oleh Google sekarang memecahkan masalah ini. Ini mengidentifikasi tindakan berulang dalam video, termasuk yang tidak digunakan dalam pelatihan. Akibatnya, model mengembalikan data pada frekuensi tindakan berulang yang dikenal dalam video. Colab sudah tersedia .







Model SPICE



Sebelumnya, Anda harus mengandalkan algoritma pemrosesan sinyal yang canggih untuk menentukan nada. Tantangan terbesar adalah memisahkan suara yang sedang dipelajari dari kebisingan latar belakang atau suara instrumen yang menyertainya. Model pra-terlatih sekarang tersedia untuk tugas ini yang mendeteksi frekuensi tinggi dan rendah. Model ini tersedia untuk digunakan di web dan perangkat seluler.



Detektor jarak sosial



Kasus membuat program yang dapat Anda lacak apakah orang mengamati jarak sosial. Penulis menceritakan secara rinci bagaimana ia memilih model pra-pelatihan, bagaimana ia mengatasi tugas mengenali orang, dan bagaimana, menggunakan OpenCV, ia mengubah gambar menjadi proyeksi ortografis untuk menghitung jarak antara orang. Anda juga dapat membiasakan diri dengan kode sumber proyek.







Pengakuan dokumen khas



Saat ini, ada ribuan variasi dokumen templat yang paling umum seperti tanda terima, faktur, dan cek. Sistem otomatis yang ada yang dirancang untuk bekerja dengan jenis templat yang sangat terbatas. Google menyarankan menggunakan pembelajaran mesin untuk ini. Artikel ini membahas arsitektur model dan hasil dari data yang diperoleh. Alat akan segera menjadi bagian dari layanan AI Dokumen .



Cara membuat pipeline scalable untuk pengembangan dan penerapan algoritma pembelajaran mesin untuk ritel tanpa kontak



Startup Israel Trigo berbagi pengalamannya menggunakan pembelajaran mesin dan visi komputer untuk ritel take-and-go. Perusahaan adalah pemasok sistem yang memungkinkan toko untuk beroperasi tanpa mesin kasir. Para penulis memberi tahu tugas apa yang mereka hadapi dan menjelaskan mengapa mereka memilih PyTorch sebagai kerangka kerja untuk pembelajaran mesin, dan Allegro AI Trains untuk infrastruktur dan bagaimana mereka mengatur proses pengembangan.



Sekian, terima kasih atas perhatiannya!



All Articles