Apa itu jaringan saraf grafis



Jaringan grafik adalah cara menerapkan model jaringan neural klasik ke data grafik. Grafik, tidak memiliki struktur biasa seperti gambar (setiap piksel memiliki 8 tetangga) atau teks (urutan kata), untuk waktu yang lama tidak terlihat dari model saraf klasik, yang tersebar luas di bidang pembelajaran mesin dan kecerdasan buatan . Sebagian besar model vektorisasi grafik (membangun representasi vektor dari simpul dalam grafik) agak lambat dan menggunakan algoritma berdasarkan faktorisasi matriks atau dekomposisi grafik spektral. Pada 2015-16, model random walk yang lebih efisien (DeepWalk, Line, Node2vec, Hope) muncul. Namun, mereka juga memiliki keterbatasan, karena mereka sama sekali tidak mempengaruhi fitur tambahan saat membuat model vektor dari grafik,yang dapat disimpan di simpul atau tepi. Munculnya jaringan saraf tiruan grafik menjadi kelanjutan logis dari penelitian di bidang penyematan grafik dan memungkinkan untuk menyatukan pendekatan sebelumnya dalam satu kerangka kerja.







Untuk apa dan bagaimana pengaturannya



Satu lapisan jaringan neural grafik adalah lapisan jaringan neural yang terhubung penuh biasa, tetapi bobot di dalamnya tidak diterapkan ke semua data masukan, tetapi hanya untuk yang bertetangga dengan simpul tertentu dalam grafik, selain representasi sendiri dari lapisan sebelumnya. Bobot untuk tetangga dan simpul itu sendiri dapat diatur dengan matriks bobot yang sama atau dengan dua matriks terpisah. Normalisasi dapat ditambahkan untuk mempercepat konvergensi; fungsi non-linier dari aktivasi dapat bervariasi, tetapi konstruksi umumnya tetap sama. Pada saat yang sama, jaringan konvolusional grafik mendapatkan namanya karena pengumpulan informasi dari tetangganya, meskipun mekanisme perhatian grafik (GAT) atau model pembelajaran induktif (GraphSAGE) lebih dekat dengan definisi ini.



Aplikasi



Sistem pemberi rekomendasi



Grafik berkembang dalam konteks interaksi pengguna dengan produk di platform e-commerce. Akibatnya, banyak perusahaan menggunakan jaringan saraf grafis untuk membuat sistem pemberi rekomendasi. Biasanya, grafik digunakan untuk memodelkan interaksi pengguna dengan produk, mengajarkan embeddings dengan mempertimbangkan sampel negatif yang dipilih dengan benar, dan dengan memberi peringkat hasil, penawaran yang dipersonalisasi untuk produk dipilih dan ditampilkan kepada pengguna tertentu secara real time. Salah satu layanan pertama dengan mekanisme seperti itu adalah Uber Eats : jaringan saraf GraphSage memilih rekomendasi untuk makanan dan restoran.



Meskipun grafik untuk rekomendasi makanan relatif kecil karena kendala geografis, beberapa perusahaan menggunakan jaringan saraf dengan miliaran sambungan. Misalnya, raksasa China, Alibaba, telah meluncurkan embeddings grafik dan jaringan saraf grafik untuk miliaran pengguna dan produk. Hanya membuat grafik seperti itu adalah mimpi buruk bagi pengembang. Namun berkat pipa AligraphAnda dapat membuat grafik 400 juta node hanya dalam lima menit. Impresif. Aligraph mendukung penyimpanan grafik terdistribusi yang efisien, operator pengambilan yang dioptimalkan, dan banyak jaringan neural grafik asli. Pipa ini sekarang digunakan untuk rekomendasi dan pencarian yang dipersonalisasi di berbagai produk perusahaan.



Pinterest mengusulkan model PinSage yang secara efisien mencocokkan tetangga menggunakan PageRank yang dipersonalisasi dan memperbarui embeddings vertex dengan menggabungkan informasi dari tetangga. Model PinnerSage berikutnya sudah dapat bekerja dengan multi-embeddings untuk mempertimbangkan selera pengguna yang berbeda. Ini hanyalah beberapa contoh penting di bidang sistem pemberi rekomendasi. Anda juga dapat membaca tentang eksplorasi Amazon atas grafik pengetahuan dan grafik jaringan saraf , atau penggunaan jaringan syaraf grafik oleh Fabula AI untuk mendeteksi berita palsu . Tetapi bahkan tanpa ini, jelas bahwa grafik jaringan saraf menunjukkan hasil yang menjanjikan dengan sinyal yang signifikan dari interaksi pengguna.



Optimasi kombinatorial



Solusi pengoptimalan kombinatorial merupakan inti dari banyak produk penting di bidang keuangan, logistik, energi, sains, dan desain elektronik. Sebagian besar tugas ini dijelaskan menggunakan grafik. Dan selama abad terakhir, banyak upaya telah dilakukan untuk menciptakan solusi algoritmik yang lebih efisien. Namun, revolusi pembelajaran mesin telah memberi kami pendekatan baru yang menarik.



Tim Google Brain menggunakan jaringan neural grafik untuk mengoptimalkan konsumsi daya, area, dan kinerja chip untuk perangkat keras baru seperti Google TPU... Prosesor komputer dapat direpresentasikan sebagai grafik memori dan komponen logika, masing-masing dengan koordinat dan jenisnya sendiri. Menentukan lokasi untuk setiap komponen, dengan mempertimbangkan batasan kepadatan penempatan dan perutean beban, masih merupakan proses yang memakan waktu, sebuah karya seni bagi para insinyur elektronik. Kombinasi model grafik dengan pembelajaran kebijakan dan penguatan memungkinkan menemukan penempatan chip yang optimal dan membuat chip yang lebih berkinerja dibandingkan dengan yang dirancang oleh manusia.



Pendekatan lain melibatkan pengintegrasian model pembelajaran mesin ke dalam alat solusi yang ada. Misalnya tim yang dipimpin oleh M. Gassmengusulkan jaringan grafik yang mempelajari kebijakan pemilihan variabel cabang-dan-terikat: operasi kritis dalam alat solusi program linier campuran-integer (MILP). Hasilnya, representasi yang dipelajari mencoba meminimalkan durasi alat solusi dan mendemonstrasikan trade-off yang baik antara kecepatan output dan kualitas solusi.



Dalam kolaborasi yang lebih baruDeepMind dan Google menggunakan jaringan grafik dalam dua sub-masalah utama yang diselesaikan dengan alat MILP: penugasan variabel dan batasan pada nilai target. Pendekatan berbasis jaringan saraf yang diusulkan ternyata 2-10 kali lebih cepat daripada alat solusi yang ada yang menggunakan kumpulan data besar, termasuk yang digunakan oleh Google untuk sistem pengemasan dan perencanaan produk. Jika Anda tertarik dengan bidang ini, maka Anda dapat merekomendasikan beberapa studi terbaru ( 1 , 2 ), yang membahas kombinasi jaringan syaraf tiruan grafik, pembelajaran mesin, dan pengoptimalan kombinatorial jauh lebih dalam.



Visi komputer



Objek di dunia nyata sangat saling berhubungan, sehingga gambar dari objek ini dapat berhasil diproses menggunakan jaringan saraf tiruan grafik. Misalnya, Anda dapat melihat konten gambar melalui grafik adegan - sekumpulan objek dalam gambar dengan hubungannya. Grafik adegan digunakan untuk menemukan gambar, memahami dan memahami isinya, menambahkan subtitle, menjawab pertanyaan visual, dan menghasilkan gambar. Grafik ini dapat sangat meningkatkan performa model Anda.



Di salah satu karya Facebookmenjelaskan bahwa Anda dapat meletakkan objek dari kumpulan data COCO populer ke dalam bingkai, mengatur posisi dan ukurannya, dan berdasarkan informasi ini, grafik pemandangan akan dibuat. Dengan bantuannya, jaringan neural grafik menentukan embeddings objek, dari mana, jaringan neural konvolusional membuat topeng, bingkai, dan garis objek. Pengguna akhir cukup menambahkan node baru ke grafik (dengan menentukan posisi dan ukuran relatif node) sehingga jaringan neural dapat menghasilkan gambar dengan objek ini.



Sumber grafik lain dalam computer vision adalah penjajaran dua gambar yang saling berhubungan. Ini adalah masalah klasik yang biasanya diselesaikan secara manual dengan membuat deskriptor. Magic Leap, sebuah perusahaan grafis 3D membuat arsitektur berdasarkan jaringan saraf grafis yang disebut SuperGlue . Arsitektur ini memungkinkan pencocokan video waktu nyata untuk pemutaran ulang adegan 3D, pengenalan lokasi, lokalisasi dan pemetaan simultan (SLAM). SuperGlue terdiri dari jaringan saraf grafis berdasarkan mekanisme perhatian. Ini mengajarkan Anda untuk menemukan poin-poin penting dari gambar, yang kemudian ditransfer ke lapisan transport yang optimal untuk pencocokan. Pada kartu video modern, model ini mampu bekerja dalam waktu nyata dan dapat diintegrasikan ke dalam sistem SLAM. Lebih lanjut tentang kombinasi grafik dan computer vision dijelaskan dalam penelitian ini: 1 , 2 .



Fisika dan kimia



Representasi interaksi antar partikel atau molekul dalam bentuk grafik dan prediksi sifat bahan dan zat baru menggunakan jaringan saraf tiruan grafik memungkinkan penyelesaian berbagai masalah ilmu pengetahuan alam. Misalnya, melalui proyek Open Catalyst , Facebook dan CMU mencari cara baru untuk menyimpan energi matahari dan angin yang dapat diperbarui. Salah satu solusi yang mungkin adalah mengubah energi ini melalui reaksi kimia menjadi bahan bakar lain, misalnya hidrogen. Tetapi untuk ini perlu dibuat katalis baru untuk reaksi kimia intensitas tinggi, dan metode yang sekarang dikenal seperti DFT sangat mahal. Penulis proyek mempostingkumpulan katalis terbesar, peluruhan DFT, dan garis dasar untuk jaringan saraf grafis. Para pengembang berharap untuk menemukan simulasi molekuler berbiaya rendah baru yang melengkapi simulasi mahal saat ini yang berjalan selama berhari-hari dengan perkiraan energi yang efisien dan gaya antarmolekul yang dihitung dalam milidetik.



Para peneliti di DeepMind juga telah menggunakan jaringan saraf grafik untuk meniru dinamika sistem partikel kompleks seperti air dan pasir. Dengan memprediksi gerakan relatif setiap partikel di setiap langkah, seseorang dapat menciptakan kembali dinamika seluruh sistem secara masuk akal dan mempelajari lebih lanjut tentang hukum yang mengatur gerakan ini. Misalnya, inilah cara mereka mencoba memecahkan masalah paling menarik dari masalah yang belum terpecahkan dalam teori zat padat - transisi ke keadaan kaca... Grafik jaringan saraf tidak hanya memungkinkan Anda untuk meniru dinamika selama transisi, tetapi juga membantu Anda lebih memahami bagaimana partikel mempengaruhi satu sama lain tergantung pada waktu dan jarak.



Laboratorium fisika Amerika, Fermilab, sedang mengerjakan jaringan saraf grafik di Large Hadron Collider untuk memproses jutaan data dan menemukan data yang mungkin terkait dengan penemuan partikel baru. Penulis ingin mengimplementasikan graph neural network dalam programmable logic integrated circuit dan menyematkannya dalam prosesor untuk pengumpulan data , sehingga graph neural network dapat digunakan dari jarak jauh dari mana saja di dunia. Baca lebih lanjut tentang aplikasinya dalam fisika energi tinggi di studi ini .



Pengembangan obat



Perusahaan farmasi secara aktif mencari metode baru pengembangan obat, bersaing ketat satu sama lain dan menghabiskan miliaran dolar untuk penelitian. Dalam biologi, grafik dapat digunakan untuk merepresentasikan interaksi pada level yang berbeda. Misalnya, pada tingkat molekuler, ikatan antar node akan menunjukkan gaya interatomik dalam molekul, atau interaksi antara basa asam amino dalam protein. Dalam skala yang lebih besar, grafik dapat merepresentasikan interaksi antara protein dan RNA atau produk metabolik. Bergantung pada tingkat abstraksi, grafik dapat digunakan untuk identifikasi yang ditargetkan, memprediksi sifat molekuler, skrining throughput tinggi, desain obat baru, desain protein, dan penggunaan ulang obat.



Mungkin hasil yang paling menjanjikan dari penggunaan jaringan syaraf tiruan grafik di area ini adalah hasil kerja para peneliti di MIT, yang diterbitkan di Cell pada tahun 2020. Mereka menerapkan model pembelajaran mendalam yang disebut Chemprop , yang memprediksi sifat antibiotik dari molekul: menghambat perkembangbiakan E. coli. Setelah pelatihan hanya pada 2.500 molekul dari perpustakaan yang disetujui FDA, Chemprop diterapkan ke kumpulan data yang lebih besar, termasuk Drug Repurposing Hub yang berisi molekul Halicin yang diganti namanya setelah AI HAL 9000dari film "A Space Odyssey 2001". Perlu dicatat bahwa sebelumnya Halicin dipelajari hanya dalam kaitannya dengan pengobatan diabetes, karena strukturnya sangat berbeda dengan antibiotik yang dikenal. Tetapi percobaan klinis in vitro dan in vivo telah menunjukkan bahwa Halicin adalah antibiotik spektrum luas. Perbandingan ekstensif dengan model jaringan neural yang kuat menyoroti pentingnya properti Halicin ditemukan menggunakan jaringan neural grafik. Selain peran praktis dari pekerjaan ini, arsitektur Chemprop menarik untuk orang lain: tidak seperti banyak jaringan saraf grafis, ia berisi 5 lapisan dan 1.600 dimensi tersembunyi, yang jauh lebih banyak daripada parameter khas jaringan saraf grafis untuk tugas-tugas semacam itu. Semoga ini hanya salah satu dari sedikit penemuan AI dalam pengobatan baru di masa depan. Baca lebih lanjut tentang arahan ini di sinidan di sini .



Saat grafik jaringan saraf menjadi tren



Penyematan grafik mencapai puncaknya pada tahun 2018, ketika penyematan struktural dan model jaringan saraf grafik yang diusulkan pada tahun 2016 diuji dalam banyak aplikasi praktis dan menunjukkan efisiensi yang tinggi, termasuk contoh paling terkenal dari model PinSAGE yang digunakan dalam rekomendasi dari jejaring sosial Pinterest. Sejak itu, pertumbuhan penelitian tentang topik ini telah menjadi eksponensial, dan ada lebih banyak aplikasi di area di mana metode sebelumnya tidak dapat secara efektif memperhitungkan komunikasi antar objek dalam model. Perlu dicatat bahwa otomatisasi pembelajaran mesin dan pencarian arsitektur jaringan saraf baru yang efisien juga telah menerima dorongan baru untuk pengembangan berkat jaringan saraf grafik.



Apakah mereka juga menjadi tren di Rusia?



Sayangnya, Rusia dalam banyak kasus tertinggal dari penelitian modern di bidang kecerdasan buatan. Jumlah artikel di konferensi internasional dan di jurnal terkemuka adalah urutan yang lebih kecil dari artikel oleh para ilmuwan dari Amerika Serikat, Eropa dan Cina, dan dukungan keuangan untuk penelitian di bidang baru menemui perlawanan di lingkungan keras akademisi yang terjebak di dalamnya. pendekatan dari abad terakhir dan mengeluarkan hibah lebih pada prinsip nepotisme gerontokratis, daripada pencapaian nyata. Alhasil, pada konferensi-konferensi terkemuka seperti TheWebConf, ICDM, WSDM, KDD, NIPS, nama-nama ilmuwan Rusia sebagian besar berafiliasi dengan universitas-universitas Barat, yang mencerminkan tren brain drain, serta persaingan serius dari negara-negara maju di bidangnya. pengembangan AI, terutama China. ...



Jika Anda melihat konferensi bidang ilmu komputer dengan nilai A * tertinggi menurut Core, misalnya konferensi tentang komputasi kinerja tinggi, maka rata-rata besaran hibah untuk artikel yang diterima di jalur utama adalah $ 1 juta, yang kalah program maksimum dari yayasan ilmiah Rusia dalam 15 30 kali. Dalam kondisi seperti itu, penelitian yang dilakukan pada perusahaan besar dengan organisasi R&D ternyata merupakan satu-satunya pendorong dalam pencarian pendekatan baru berdasarkan graph neural network.



Di Russia teori graph neural network sedang dipelajari di Higher School of Economics dibawah kepemimpinan saya, ada juga group di Skoltech dan MIPT, penelitian terapan dilakukan di ITMO, Kazan Federal University, serta di Sber's AI Laboratory , dalam proyek R&D JetBrains, Mail.ru Group, Yandex.



Di panggung dunia, drivernya adalah Twitter, Google, Amazon, Facebook, Pinterest.



Tren sekilas atau jangka panjang?



Seperti semua tren, mode untuk jaringan saraf grafik telah memberi jalan kepada transformator dengan arsitektur besar mereka yang menggambarkan semua kemungkinan ketergantungan dalam data tidak terstruktur, tetapi menghasilkan model yang menghabiskan biaya jutaan dolar untuk dilatih dan hanya tersedia untuk perusahaan besar. Jaringan syaraf tiruan grafik tidak hanya berhasil menggantikan tempatnya sebagai standar untuk membuat pembelajaran mesin pada data struktural, tetapi juga telah terbukti menjadi cara yang efektif untuk membangun perhatian struktural di industri terkait, termasuk efisiensi tinggi dalam masalah pembelajaran multi-contoh dan pembelajaran metrik . Saya yakin berkat grafik jaringan saraf itulah kita akan mendapatkan penemuan baru dalam ilmu material, farmakologi, dan kedokteran. Mungkin akan ada model baru yang lebih efisien untuk data besar yang memiliki sifat mentransfer pengetahuan antara data grafik yang berbeda.Model akan mengatasi masalah penerapan grafik, yang strukturnya berlawanan dengan kemiripan fitur, tetapi secara umum, area pembelajaran mesin ini telah berubah menjadi ilmu independen, dan inilah saatnya untuk menyelami sekarang, inilah kesempatan langka untuk berpartisipasi dalam pengembangan industri baru, baik dalam sains maupun aplikasi industri.



Jika Anda ingin meningkatkan keterampilan dalam pembelajaran mesin dan mempelajari jaringan saraf grafik, kami menunggu Anda di MADE Big Data Academy kami .



All Articles