Kecerdasan Buatan dan Pembelajaran Mesin dalam Webcasting: Tren Terbaru





Halo, Habr. Nama saya Alexander Alpern, saya adalah CEO dan pendiri Grup Webinar. Hari ini saya ingin membahas masalah seperti penggunaan pembelajaran mesin dan teknologi kecerdasan buatan dalam penyiaran Internet, pemrosesan konten media, dan pengirimannya kepada pengguna.



Untuk apa ini? Meningkatkan penayangan, loyalitas pemirsa, konten informasi program, serta mengurangi beban di jaringan hanyalah sebagian dari keuntungan yang diberikan oleh teknologi modern.



Pandemi + lalu lintas = masalah



Menurut TeleGeography, yang menganalisis nilai tukar lalu lintas Internet global, konsumsi lalu lintas meroket pada tahun 2020. Jadi, rata-rata global meningkat dari sekitar 120 menjadi 170 Tbps, pada puncaknya - 300 Tbps.



gambar



Pada prinsipnya, pertumbuhannya sudah cukup besar, tetapi tahun lalu semua rekor dipecahkan - pertumbuhannya 47%. Peti mati terbuka dengan mudah - ratusan juta orang dikurung di rumah, sehingga aktivitas menggunakan messenger Internet, platform pembelajaran online, layanan cloud gaming, dan, tentu saja, platform video seperti YouTube telah meningkat secara dramatis.



Titik pertukaran lalu lintas yang paling padat berada di Jerman, Frankfurt (DE-CIX FRA) dan di Belanda, Amsterdam (AMS-IX). Pada bulan Maret, pusat peer-to-peer DE-CIX mencapai puncak lalu lintas sepanjang waktu sebesar 9,1 Tbps .



Di Rusia, situasi serupa diamati - pada Maret-April 2020, bioskop online mencatat peningkatan lalu lintas 2-4 kali lipat. Alasannya masih sama - karena pandemi dan isolasi diri, orang-orang diisolasi di apartemen dan rumahnya sendiri, sehingga internet menjadi salah satu cara untuk menghibur diri. Lalu lintas seluler pada periode yang sama tumbuh 10-30%, terutama karena obrolan video dan pesan instan.



Sampai-sampai Netflix dan YouTube diturunkankualitas video untuk pengguna Eropa. YouTube mulai menayangkan video dalam definisi standar, bukan HD, dan Netflix menurunkan resolusinya sebesar 25%.



Apa yang harus dilakukan?



Idealnya, meningkatkan kapasitas dan throughput infrastruktur jaringan, baik secara lokal maupun global. Semuanya rumit di sini, karena penyedia Internet, komunikasi seluler, dan layanan telekomunikasi lainnya tidak selalu dapat menginvestasikan sumber daya yang signifikan.



Opsi kedua adalah mengoptimalkan konten Anda. Ini tidak banyak mengacu pada pengurangan kualitas video atau audio, seperti metode lainnya. Kami akan mempertimbangkannya di bawah.



Mengoptimalkan kompresi video yang berbeda



Netflix adalah penyedia konten media terbesar. Beberapa tahun yang lalu, dia memperkenalkan praktik memilih profil kompresi yang berbeda untuk berbagai video, dengan mempertimbangkan karakteristiknya.



Netflix memiliki banyak pengalaman video, termasuk kompresi konten. Dengan menggunakan pengembangannya sendiri, perusahaan melatih sistem mirip saraf yang mengevaluasi atribut video tingkat rendah, menentukan kelasnya, dan kemudian menemukan parameter optimal untuk setiap kelas.



Parameter seperti dinamika gambar, tingkat kejelasan dan keseluruhan kompleksitas plot dievaluasi. Dalam hitungan menit, sistem mengevaluasi dinamika plot, tingkat kejelasan, dan saturasi keseluruhan "gambar". Berdasarkan data analisis, sistem mengambil keputusan tentang pengoptimalan video. Jadi, jika tayangan atau siarannya tidak terlalu dinamis, maka kualitas video bisa diturunkan. Jika gambar berubah dengan cepat, warnanya jenuh, dan plotnya rumit, kualitasnya akan sedikit menurun atau tetap pada tingkat yang sama.



gambar



Dengan demikian, optimalisasi transmisi video tercapai, beban pada infrastruktur jaringan berkurang. Pengerjaan dengan video dilakukan sedemikian rupa sehingga hasil akhirnya tidak terlihat oleh konsumen konten. Dengan kata lain, penonton tidak memperhatikan apapun. Untuk kompresi, perusahaan menggunakanBerbagai codec dan model kompresi, termasuk 4K VMAF , sehingga jaringan tidak sesak bahkan saat streaming video 4K.



Memilih sumber video dengan kualitas optimal



Resolusi tinggi, dan karenanya sejumlah besar data yang ditransmisikan, tidak berarti video berkualitas baik dikirim ke penerima. Contohnya adalah gif yang diposting di atas.



Memilih sumber video berkualitas baik merupakan masalah mendesak bagi distributor paket saluran TV. Ssimwave hadir dengan solusi pembelajaran mesin yang secara otomatis memilih sumber konten dengan kualitas tertinggi.



gambar



Contohnya adalah siaran saluran CNN. Dalam satu sumber, parameter video adalah 1080 @ 29.97i, MPEG-2, 40 Mbps, dan sumber lainnya - dengan 720p60, H264, 22 Mbps. Seperti disebutkan di atas, resolusi tinggi sama sekali tidak berarti kualitas video yang baik bagi penerimanya. Kualitas dipengaruhi oleh banyak faktor, termasuk kompresi dan format warna, rentang dinamis, prosedur transcoding, teknologi pengiriman, dan versi pemutar pelanggan.



Sangat tidak mungkin untuk menilai semua ini secara manual. Tetapi jaringan saraf mampu mengatasi tugas tersebut tanpa masalah. Ssimwave mampu mengembangkan solusi yang memungkinkan Anda memilih sumber transmisi dengan kualitas tertinggi dan volume data minimum dalam hitungan detik.



Bukan karena lalu lintas saja



Pembelajaran mesin, kecerdasan buatan, dan jaringan saraf tidak hanya membantu mengoptimalkan volume konten yang dikirimkan. Ada banyak bidang lain di mana teknologi sangat diperlukan sekarang.



Navigasi katalog video



Banyak perusahaan konten media memiliki katalog - dengan permainan, video, film, dan pertunjukan. Menurut Netflix, ketika memilih film untuk ditonton, pelanggan cenderung memperhatikan ikon poster film. Menurut dengan direktur kreatif perusahaan Nick Nelson, di 82% kasus, pilihan film ditentukan oleh disajikan ikon / poster.



Oleh karena itu, semakin berhasil gambar tersebut, semakin tinggi kemungkinan pemirsa akan memilih bagian konten tertentu ini. Semua ini relevan tidak hanya untuk video, tetapi juga untuk barang digital lainnya.



gambar



Untuk mengonfirmasi atau menyangkal pendapat Nelson, Accedo telah bermitra dengan AWS dan British Television Corporation ITV untuk menjalankan pengujian A / B guna mengidentifikasi faktor yang memengaruhi pilihan pengguna. Kesimpulannya tidak terlalu mengejutkan: pengguna memilih film, dipandu oleh emosi mereka saat melihat tangkapan layar. Diperlukan waktu kurang dari 2 detik untuk mengevaluasi tangkapan layar.



Karenanya, pembelajaran mesin dan teknologi AI dapat digunakan untuk memilih tangkapan layar dengan konversi yang optimal. Untuk film, tangkapan layar seperti itu biasanya menyertakan gambar pahlawan yang wajahnya mengekspresikan emosi, dan paling sering gambar dengan antagonis dipilih. Tangkapan layar dengan sekelompok pahlawan kurang diminati.



Selain itu, kecerdasan buatan membantu membentuk koleksi yang berbeda untuk berbagai kategori / segmen pemirsa - baik secara sosial maupun geografis. Sekarang tidak mengherankan jika katalog terlihat berbeda di berbagai negara atau wilayah di negara yang sama. Tetapi hanya 10-20 tahun yang lalu, situasinya berbeda.



Meningkatkan konten informasi video



gambar



Ini tentang membuat dan menyusun metadata multimedia untuk berbagai video - misalnya, video olahraga. IBM Watson, superkomputer IBM dengan kecerdasan buatan built-in, sangat menonjol di sini. Dia dapat membuat deskripsi visual secara real time, mentranskripsikan audio, menambahkan catatan editorial.



Keterampilan ini digunakan saat bekerja dengan acara olahraga populer - misalnya, Piala Dunia, AS Terbuka, Super Bowl, dan lainnya.



AI memproses aliran siaran, menandai poin-poin penting di dalamnya, menambahkan catatan dan komentar. Selanjutnya, aliran yang sudah diproses dikirim ke editor program penyiaran, atau disiarkan langsung ke pemirsa.



Mengurangi churn pelanggan



Pembelajaran mesin dan kecerdasan buatan sangat bagus dalam mencegah churn pelanggan. Ini terjadi jika minat pengguna terhadap konten menurun. Menurut data kami, konten yang tidak menarik atau terlalu kompleks dapat menyebabkan pemutusan hubungan kerja bagi seperempat pengguna. Ini banyak dan ini tidak boleh dibiarkan.



Untuk mengurangi churn rate, penting untuk:



  • memahami apa yang dapat menyebabkan churn
  • mengotomatiskan analitik
  • menggunakan alat perkiraan


Analytics menggunakan data seperti informasi pengguna, keterlihatan konten, peringkat pengguna, aktivitas interaksi pengguna dengan dukungan (di sini kita tidak hanya dapat berbicara tentang video, tetapi juga tentang kursus online, seperti dalam kasus kami) dan data lainnya. Misalnya, pada platform We.Study, sistem itu sendiri secara teratur "memantau" kursus, memberikan rekomendasi khusus untuk memperbaikinya, memungkinkan Anda melacak perilaku peserta dan memprediksi churn.



Berdasarkan hasil analisis, tindakan tertentu dapat diambil - untuk mengubah konten, program pelatihan, jika ini adalah kursus - untuk meningkatkan interaksi dengan pengguna.



Mempersonalisasi konten unggulan



gambar



Semua pengguna YouTube tahu tentang konten yang direkomendasikan. Semakin berhasil rekomendasinya, semakin tinggi kemungkinan pengguna akan menonton video atau melihat jenis konten lain.



Kasus ilustratif - proyek IBM Watson dan platform Iris.tv. Mitra berhasil mencapai personalisasi konten yang optimal. Untuk melakukan ini, video terlebih dahulu melewati superkomputer yang mengumpulkan metadata. Kemudian platform menganalisis data ini untuk membuat kategori dan judul baru dari perpustakaan film.



Selain itu, dengan bantuan pembelajaran mesin, platform dapat melatih untuk menganalisis minat pengguna tertentu untuk menjamin menawarkan video yang menarik kepada seseorang setelah dia menonton program berikutnya.



Apa berikutnya?



Ada banyak kasus penggunaan AI dan pembelajaran mesin, jadi hanya poin yang paling mengungkap yang ditunjukkan dalam artikel. Kesimpulan umumnya adalah bahwa teknologi ini mulai digunakan secara sistematis. Sebelumnya, mereka hanya digunakan sebagai ujian. Sekarang ratusan dan ribuan perusahaan konten menggunakan pembelajaran mesin untuk mengoptimalkan konten, men-debug proses bisnis, menarik pengguna baru, dan mempertahankan yang lama.



Selama 3-5 tahun ke depan, sebagian besar penyedia konten media akan beralih menggunakan teknologi modern, karena fakta bahwa mereka memungkinkan penyelesaian masalah pelanggan individu dan bisnis secara keseluruhan.



All Articles