SERP: Meningkatkan Algoritma untuk Pasar dengan Menggunakan Kecerdasan Buatan

Sebuah platform universal untuk menciptakan pasar, cocok untuk proyek bisnis yang sama sekali berbeda dari toko grosir hingga layanan perekrutan, membutuhkan perbaikan terus-menerus, karena meningkatnya persyaratan untuk layanan online saat ini sudah membutuhkan pekerjaan kecerdasan buatan. Dan kepuasan klien dengan hasil pencarian, dan, akibatnya, keberhasilan bisnis, bergantung pada pengaturan sistem AI yang benar.





Sebagai contoh, kita dapat mengambil pencarian kontekstual yang digunakan di mesin pencari. Setiap mesin pencari mencoba untuk memenangkan persaingan dan meningkatkan kualitas pencarian, tetapi dalam dunia yang berubah dengan cepat, arti ekspresi verbal dapat berubah secara signifikan. Misalnya, saat meminta kata "feed", mesin pencari sebelumnya menawarkan hasil "pita satin", sedangkan sekarang hasil pencarian menampilkan informasi tentang rantai toko dan portal informasi. Tetapi kecerdasan buatan datang untuk menyelamatkan dalam penerbitan hasil, yang membantu mengoreksi hasil dalam waktu singkat.





Katakanlah sepotong teks mendefinisikan kata "pita" sebagai bagian dari paket cantik. Untuk kesederhanaan, kami mengklasifikasikan semua arti kata ini tanpa klarifikasi, misalnya, karena jaringan ultra-presisi - Convolutional Neural Networks (CNN). Arsitektur CNN ini menggunakan apa yang disebut ensembel jaringan ultra-presisi dan berulang dan pada keluarannya memberikan definisi yang relevan dari kata "tape" berdasarkan konten semantik teks. Data masukan berupa matriks dengan tinggi tetap  n. Selain itu, setiap baris merupakan pemetaan vektor dari pengenal, yaitu kata-kata dalam ruang fitur berdimensi  k... Untuk membuat ruang fitur, akan lebih mudah menggunakan alat semantik distribusi FastText, Glove, Word2mVec. Matriks diproses oleh filter dengan lebar tetap, yang sama dengan dimensi ruang fitur. Untuk memilih ukurannya, parameter ketinggian baris yang berdekatan h dipilih . Oleh karena itu, ukuran matriks keluaran tergantung pada ketinggian filter dan matriks asli. Setelah tahap ini, peta fitur diproses oleh lapisan subsampling, mengurangi dimensi peta fitur yang dihasilkan, dan dialokasikan untuk setiap konvolusi, dan informasi yang dominan diekstraksi. Kemudian peta fitur digabungkan menjadi vektor fitur, yang dimasukkan ke dalam penghitungan label kelas akhir.





, , , . , . CBOW, , . : softmax โ€“ , , . , k . (2k+1). .





skip-gram, , , .





, . , , โ€“ , , , โ€“ . : -, -. โ€“ , .





, โ€“ , , , 5 .





-

. , , , , .





, 45 , , , . , , . ยซยป, , , , , .





. , . , .  . , . ยซยป . . Negative Sampling. ยซยป :





s (x, ฯ‰)

, , :





s (x, ฯ‰)

  .





-s (x, ฯ‰)

โ€“ .





. .





Kombinasi algoritma peringkat yang seimbang akan meningkatkan kualitas seluruh sistem. Tetapi kita tidak boleh melupakan pengecualian, karena sistem peringkat Google telah mencatat bahwa mesin pencari mereka belum siap untuk akhirnya mempercayakan peringkat ke algoritma pembelajaran mesin. Model yang dibuat secara otomatis dapat berperilaku tak terduga pada kelas kueri baru yang tidak seperti kueri dari set pelatihan dibandingkan dengan model yang dibuat oleh pakar manusia.








All Articles