Dalam makalah yang baru-baru ini diterbitkan di Physical Review Research, kami menunjukkan bagaimana pembelajaran mendalam menyederhanakan solusi persamaan mekanika kuantum fundamental untuk sistem nyata. Pada saat yang sama, tidak hanya masalah ilmiah mendasar diselesaikan, tetapi juga prospek penggunaan praktis dari hasil yang diperoleh di masa depan terbuka.
Para peneliti akan dapat membuat prototipe bahan dan senyawa baru dalam silico sebelum mencoba mensintesisnya di laboratorium. Juga memposting kodedari penelitian ini; dengan demikian, tim fisika dan kimia komputasi dapat mengembangkan pekerjaan mereka dan menerapkannya pada berbagai masalah. Sebagai bagian dari studi, arsitektur jaringan saraf baru, Jaringan Syaraf Fermionik atau FermiNet, dikembangkan, yang sangat cocok untuk mensimulasikan keadaan kuantum kumpulan besar elektron - dan semua ikatan kimia didasarkan pada elektron. FermiNet menunjukkan untuk pertama kalinya bagaimana menggunakan pembelajaran mendalam untuk menghitung energi atom dan molekul dari awal. Model yang dihasilkan ternyata cukup akurat untuk aplikasi praktis dan pada saat artikel asli diterbitkan (Oktober 2020) tetap menjadi metode jaringan saraf paling akurat yang digunakan di industri. Diasumsikanbahwa metode dan alat terkait dapat bermanfaat dalam memecahkan masalah mendasar dalam ilmu pengetahuan alam. Penulis FermiNet sudah menggunakannya dalam pekerjaan mereka konvolusi protein , dinamika senyawa kaca , kromodinamika kuantum pada kisi, dan dalam banyak proyek lain membantu menerjemahkan perkembangan ini ke dalam praktik.
Sejarah singkat mekanika kuantum
Dengan menyebutkan "mekanika kuantum", Anda cenderung membingungkan lawan bicara dengan topik ini tidak seperti yang lain. Segera saya ingat gambar seperti kucing Schrödinger, yang secara paradoks dapat hidup dan mati pada saat yang sama, serta partikel elementer yang merupakan sel dan gelombang. Dalam sistem kuantum, partikel seperti elektron tidak memiliki lokasi tertentu, tidak seperti situasi dalam fisika klasik. Dalam fisika kuantum, posisi elektron dijelaskan oleh awan probabilitas - yaitu, tersebar di semua titik tersebut, di mana setiap elektron dapat muncul. Karena keadaan yang absurd ini, Richard Feynman merasa mungkin untuk menyatakan: "Saya rasa saya dapat dengan aman mengatakan bahwa tidak ada yang memahami mekanika kuantum."
Terlepas dari semua keanehan yang menakutkan ini, inti dari teori ini dapat diungkapkan hanya dalam beberapa persamaan yang rapi. Yang paling terkenal di antaranya, persamaan Schrödinger, menggambarkan perilaku partikel pada skala kuantum dengan cara yang sama seperti persamaan Newton mendeskripsikan perilaku benda pada skala makroskopis yang lebih dikenal. Sementara interpretasi persamaan ini akan memaksa siapa pun untuk memegang kepala mereka, komponen matematisnya jauh lebih mudah untuk penggunaan praktis, karena itu lahirlah "diam dan menghitung" profesor terkenal, yang dengannya mereka melawan pertanyaan filosofis yang canggung dari siswa.
Persamaan ini cukup untuk mendeskripsikan perilaku semua materi yang kita kenal pada tingkat atom dan inti. Komponen tidak logis dari mekanika kuantum mendasari semua jenis fenomena eksotis: superkonduktivitas, superfluiditas, laser, dan semikonduktor hanya mungkin terjadi karena efek kuantum. Tetapi bahkan hal yang paling sederhana seperti ikatan kovalen - komponen dasar dari semua kimia - adalah hasil dari interaksi elektron kuantum. Ketika aturan-aturan ini akhirnya berhasil diterapkan pada tahun 1920-an, para ilmuwan menyadari bahwa untuk pertama kalinya sebuah teori telah dibuat yang merinci kerja semua kimia. Pada prinsipnya, persamaan kuantum dapat dengan mudah diadaptasi untuk molekul yang berbeda, diselesaikan dengan memperhitungkan energi sistem, dan kemudian menentukan molekul mana yang akan stabil dan reaksi mana yang akan terjadi secara spontan. Tapi,ketika percobaan dilakukan untuk duduk dan menghitung solusi untuk persamaan ini, ternyata ini layak untuk atom yang paling sederhana (hidrogen) dan secara praktis tidak untuk atom yang lain. Semua kalkulasi lainnya ternyata terlalu rumit.
Optimisme yang memusingkan pada hari-hari itu dengan indah disimpulkan oleh Paul Dirac:
Jadi, hukum fisika dasar yang diperlukan untuk teori matematika yang akan menjelaskan sebagian besar fisika dan semua kimia sudah diketahui. Tangkapannya adalah bahwa dalam praktiknya penerapan hukum-hukum ini memberikan persamaan yang terlalu kompleks, yang secara obyektif tidak dapat kita pecahkan. Oleh karena itu, tampaknya diinginkan untuk mengembangkan metode perkiraan untuk aplikasi praktis mekanika kuantum.
1929
Banyak yang menerima panggilan Dirac, dan segera fisikawan mulai mengembangkan metode matematika yang akan memungkinkan untuk memperkirakan perilaku ikatan molekul dan fenomena kimia lainnya pada tingkat kualitatif. Semuanya dimulai dengan deskripsi kasar tentang perilaku elektron - informasi ini dipelajari dalam kursus pengantar kimia. Dengan uraian ini, setiap elektron dibawa ke orbitalnya sendiri, yang memungkinkan Anda menghitung probabilitas sebuah elektron akan ditemukan pada titik tertentu di sekitar inti atom. Dalam hal ini, bentuk setiap orbital bergantung pada bentuk rata-rata dari semua orbital lainnya. Karena dalam deskripsi yang demikian menurut model "medan konsisten-sendiri", diasumsikan bahwa setiap elektron terikat hanya pada satu orbital, gambar ini tidak secara lengkap menyampaikan sifat-sifat elektron yang sebenarnya. Tetap saja, itu cukupuntuk menentukan energi total molekul dengan kesalahan hanya sekitar 0,5%.
Gambar 1 - orbital atom. permukaan adalah area di mana elektron kemungkinan besar berada. di wilayah biru fungsi gelombangnya positif, dan di violet itu negatif.
Sayangnya untuk ahli kimia yang berlatih, kesalahan 0,5% terlalu besar untuk ditoleransi. Energi ikatan molekul hanya sebagian kecil dari total energi suatu sistem, dan prediksi yang benar tentang apakah suatu molekul akan stabil seringkali dapat bergantung pada sedikitnya 0,001% dari total energi sistem, atau sekitar 0,2% dari sisa energi "korelasi".
Misalnya, energi total elektron dalam molekul butadiena adalah hampir 100.000 kilokalori per mol, perbedaan energi antara berbagai kemungkinan konfigurasi molekul hanya 1 kilokalori per mol. Artinya, jika perlu memprediksi dengan benar bentuk alami molekul butadiena, tingkat akurasi yang sama diperlukan seperti saat mengukur lebar lapangan sepak bola dengan akurasi satu milimeter.
Dengan perkembangan komputasi elektronik segera setelah Perang Dunia II, para ilmuwan mengembangkan banyak sekali metode komputasi yang tidak dapat digambarkan sebagai bidang yang konsisten sendiri. Metode ini dilambangkan dengan sekumpulan singkatan yang tak terbayangkan yang mencakup seluruh alfabet, tetapi masing-masing metode ini berisi semacam pertukaran antara akurasi dan efisiensi. Di satu titik ekstrim terdapat metode yang, pada kenyataannya, akurat, tetapi skalanya lebih buruk daripada secara eksponensial karena jumlah elektron meningkat - jadi metode ini tidak cocok untuk bekerja dengan sebagian besar molekul kecuali molekul terkecil. Di sisi lain, ada metode yang menskalakan secara linier tetapi tidak terlalu akurat. Metode komputasi ini memiliki dampak yang luar biasa pada kimia praktis - Hadiah Nobel Kimia 1998 dianugerahkan kepada penulis dari banyak algoritme ini.
Terlepas dari luasnya alat komputasi kuantum mekanik yang ada, masalah dalam merepresentasikan informasi secara efisien memerlukan pengembangan metode baru. Bukan kebetulan bahwa hanya puluhan ribu elektron yang terlibat dalam penghitungan kimia kuantum modern terbesar (kita berbicara tentang metode yang paling mendekati), sementara metode klasik penghitungan kimia, misalnya, dinamika molekul, memungkinkan seseorang untuk menangani jutaan atom. Tidak sulit untuk mendeskripsikan status sistem klasik - Anda hanya perlu melacak posisi dan momentum setiap partikel. Membayangkan keadaan sistem kuantum adalah tantangan yang jauh lebih besar. Kita harus menetapkan nilai probabilistik untuk setiap kemungkinan konfigurasi posisi elektron. Informasi ini dikodekan dalam fungsi gelombang,memungkinkan Anda untuk menetapkan bilangan positif atau negatif ke setiap konfigurasi elektron, dan fungsi gelombang kuadrat memberikan probabilitas sistem dapat ditemukan dalam konfigurasi seperti itu. Ruang dari semua konfigurasi yang mungkin adalah kolosal - jika Anda mencoba membayangkannya sebagai kisi dengan 100 titik di setiap dimensinya, maka jumlah konfigurasi elektron yang mungkin untuk atom silikon akan lebih besar daripada jumlah atom di alam semesta!
Di sinilah jaringan neural dalam berguna. Dalam beberapa tahun terakhir, kemajuan luar biasa telah dibuat dalam merepresentasikan distribusi probabilitas kompleks dengan dimensi tinggi menggunakan jaringan neural. Sekarang diketahui bagaimana melatih jaringan tersebut secara efektif dengan ekspektasi skalabilitasnya. Kami menyarankan bahwa karena jaringan ini telah membuktikan ketangkasannya dalam fungsi pelatihan dengan banyak dimensi dalam menyelesaikan masalah dari bidang kecerdasan buatan, mungkin jaringan ini akan berfungsi untuk merepresentasikan fungsi gelombang kuantum. Kami bukan yang pertama memiliki pemikiran seperti itu - peneliti lain, khususnya, Giuseppe Carleo dan Matthias Troyermendemonstrasikan bagaimana pembelajaran mendalam modern dapat diterapkan untuk memecahkan masalah kuantum yang ideal. Kami ingin menggunakan jaringan saraf untuk menangani masalah yang lebih realistis dalam kimia dan fisika keadaan padat, yang berarti kami perlu memperhitungkan elektron dalam penghitungan kami.
Hanya ada satu peringatan saat bekerja dengan elektron. Elektron harus mematuhi prinsip pengecualian Pauli, yaitu dua elektron tidak dapat secara bersamaan berada di tempat yang sama. Faktanya adalah bahwa elektron adalah partikel elementer dari antara fermion yang menyusun sebagian besar batu bata pertama materi, khususnya proton, neutron, quark, neutrino, dll. Fungsi gelombangnya harus antisimetris - jika Anda menukar dua elektron, fungsi gelombang dikalikan dengan -1. Jadi, ada kemungkinan nol bahwa dua elektron akan duduk di atas satu sama lain, karena kemungkinan ini (dan fungsi gelombang yang sesuai) sama dengan nol.
Oleh karena itu, perlu dikembangkan jaringan syaraf tiruan jenis baru, yang bersifat antisimetris sehubungan dengan masukan yang masuk. Kami menamakannya Fermionic Neural Network atau FermiNet. Dalam kebanyakan metode kimia kuantum, antisimetri diperkenalkan menggunakan fungsi yang disebut determinan. Determinan adalah matriks yang memiliki properti berikut: jika Anda menukar dua barisnya, maka outputnya dikalikan dengan -1, persis seperti fungsi gelombang fermion. Anda dapat mengambil sekumpulan fungsi satu elektron, menghitungnya untuk setiap elektron dalam sistem Anda, dan kemudian memasukkan semua hasilnya ke dalam satu matriks. Dalam hal ini, determinan matriks akan menjadi fungsi gelombang antisimetrik yang sesungguhnya. Batasan utama dari pendekatan ini adalah bahwa fungsi yang dihasilkan - disebut Penentu Slater - tidak dapat diterapkan secara luas.Fungsi gelombang dari sistem nyata biasanya jauh lebih kompleks. Biasanya, kombinasi linear besar determinan Slater - terkadang jutaan atau lebih - digunakan untuk memperbaiki masalah ini, dan kemudian beberapa koreksi sederhana dibuat berdasarkan pasangan elektron. Meski begitu, sistem tersebut mungkin tidak cukup akurat untuk menghitung energi.
2 – . – , 1. 1 2 , , -1. .
Jaringan neural dalam seringkali jauh lebih unggul dalam efisiensi dibandingkan kombinasi linier dari fungsi basis saat merepresentasikan fungsi kompleks. Di FermiNet, keunggulan ini dicapai dengan memasukkan masing-masing fungsi ke dalam determinannya, yaitu fungsi semua elektron. Metode ini jauh lebih kuat daripada menggunakan fungsi satu dan dua elektron. FermiNet menyediakan aliran informasi terpisah untuk setiap elektron. Tanpa memperhitungkan interaksi apa pun di antara aliran ini, jaringan tidak akan lebih ekspresif daripada determinan Slater biasa. Untuk melakukan lebih banyak, kami rata-rata informasi yang dikumpulkan dari semua aliran di setiap lapisan jaringan dan meneruskan informasi ini ke setiap aliran ke lapisan berikutnya. Karenanya, aliran semacam itu memiliki sifat simetri yang sesuai untuk menciptakan fungsi antisimetris.
Informasi tentang setiap lapisan di jaringan neural grafik digabungkan dengan cara yang serupa . Tidak seperti determinan Slater, jaringan FermiNet adalah aproksimator fungsi universal , setidaknya selama lapisan jaringan neural tetap cukup lebar. Artinya, jika kita dapat melatih jaringan ini dengan benar, maka jaringan tersebut dapat menghasilkan solusi yang hampir sama persis dengan persamaan Schrödinger.
3 – FermiNet. (, ) . FermiNet , , , . , - -1.
Kami menyesuaikan jaringan FermiNet, meminimalkan energi sistem. Untuk melakukan ini secara akurat, kita perlu menghitung fungsi gelombang di semua kemungkinan konfigurasi elektron, jadi kita harus melakukan ini kira-kira. Oleh karena itu, kami mengambil sampel konfigurasi elektron secara acak, menghitung energi secara lokal untuk setiap varian urutan elektron, dan meminimalkan energi ini, bukan energi yang sebenarnya. Metode ini disebut "Monte Carlo" karena ini mirip dengan tindakan pemain kasino yang melempar dadu berulang kali. Karena fungsi gelombang kuadrat memungkinkan untuk mengamati beberapa konfigurasi partikel di lokasi mana pun, paling mudah untuk menghasilkan sampel dari fungsi gelombang itu sendiri - intinya, mensimulasikan tindakan mengamati partikel.
Meskipun sebagian besar jaringan neural dilatih pada beberapa data eksternal, dalam kasus kami, jaringan neural itu sendiri menghasilkan masukan yang dimasukkan ke dalamnya untuk pelatihan. Situasi ini seperti menarik diri Anda keluar dari rawa dengan rambut Anda, dan berarti bahwa kita tidak memerlukan data pelatihan apa pun selain posisi inti atom di sekitar tempat elektron menari. Ide dasarnya, yang dikenal sebagai Metode Variasional Quantum Monte Carlo (atau disingkat VMC), telah ada dalam sains sejak 1960-an dan umumnya dianggap cara yang murah tetapi tidak terlalu akurat untuk menghitung energi suatu sistem. Dengan mengganti fungsi gelombang sederhana berdasarkan determinan Slater dengan fungsi dari FermiNet, kami berhasil meningkatkan akurasi pendekatan ini secara radikal pada semua sistem yang kami pertimbangkan.
4 – , FermiNet, .
Untuk memastikan bahwa FermiNet benar-benar merupakan terobosan dalam bidang subjeknya, kami mulai dengan memeriksa sistem yang dipelajari dengan baik dan sederhana, misalnya, atom dari baris pertama tabel periodik (dari hidrogen hingga neon). Ini adalah sistem kecil - 10 elektron atau kurang - sehingga mereka cocok untuk penelitian menggunakan metode yang paling akurat (tetapi secara eksponensial lebih kompleks). FermiNet jauh mengungguli penghitungan VMC yang sebanding, dan seringkali dapat memotong kesalahan menjadi setengah atau lebih dibandingkan dengan penghitungan yang dapat diskalakan secara eksponensial. Dalam sistem yang lebih besar, metode yang menjadi lebih kompleks secara eksponensial menjadi tidak dapat diterapkan, jadi kami menggunakan metode cluster berpasangan sebagai referensi. Metode ini bekerja dengan baik pada molekul dengan konfigurasi stabil, tetapi tergelincir saat ikatan diregangkan atau rusak,dan faktor-faktor tersebut sangat penting untuk memahami reaksi kimia. Meskipun skalanya jauh lebih baik daripada secara eksponensial, metode cluster terhubung yang digunakan dalam penelitian ini masih bekerja sebaik mungkin dengan molekul berukuran sedang. Kami menerapkan FermiNet ke molekul yang semakin besar, dari litium hidrida hingga bicyclobutane - ini adalah sistem terbesar yang kami lihat, dengan 30 elektron. Pada molekul terkecil, FermiNet menangkap perbedaan 99,8% yang mencengangkan antara energi cluster terikat dan energi yang berasal dari determinan Slater tunggal. Dalam kasus bicyclobutane, FermiNet masih menangkap 97% atau lebih dari energi korelasi ini - pencapaian besar untuk pendekatan yang seharusnya "murah tapi tidak tepat".Meskipun skalanya jauh lebih baik daripada secara eksponensial, metode cluster terhubung yang digunakan dalam penelitian ini masih bekerja sebaik mungkin dengan molekul berukuran sedang. Kami menerapkan FermiNet ke molekul yang semakin besar, dari litium hidrida hingga bicyclobutane - ini adalah sistem terbesar yang kami lihat, dengan 30 elektron. Pada molekul terkecil, FermiNet menangkap perbedaan 99,8% yang mencengangkan antara energi cluster terikat dan energi yang berasal dari determinan Slater tunggal. Dalam kasus bicyclobutane, FermiNet masih menangkap 97% atau lebih dari energi korelasi ini - pencapaian besar untuk pendekatan yang seharusnya "murah tapi tidak tepat".Meskipun skalanya jauh lebih baik daripada secara eksponensial, metode cluster terhubung yang digunakan dalam penelitian ini masih bekerja sebaik mungkin dengan molekul berukuran sedang. Kami menerapkan FermiNet ke molekul yang semakin besar, dari litium hidrida hingga bicyclobutane - ini adalah sistem terbesar yang kami lihat, dengan 30 elektron. Pada molekul terkecil, FermiNet menangkap perbedaan 99,8% yang mencengangkan antara energi cluster terikat dan energi yang berasal dari determinan Slater tunggal. Dalam kasus bicyclobutane, FermiNet masih menangkap 97% atau lebih dari energi korelasi ini - pencapaian besar untuk pendekatan yang seharusnya "murah tapi tidak tepat".yang diterapkan dalam studi yang dijelaskan, setiap orang bekerja sama maksimal dengan molekul berukuran sedang. Kami menerapkan FermiNet ke molekul yang semakin besar, dari litium hidrida hingga bicyclobutane - ini adalah sistem terbesar yang kami lihat, dengan 30 elektron. Pada molekul terkecil, FermiNet menangkap perbedaan 99,8% yang mencengangkan antara energi cluster terikat dan energi yang berasal dari determinan Slater tunggal. Dalam kasus bicyclobutane, FermiNet masih menangkap 97% atau lebih dari energi korelasi ini - pencapaian besar untuk pendekatan yang seharusnya "murah tapi tidak tepat".yang diterapkan dalam studi yang dijelaskan, setiap orang bekerja sama maksimal dengan molekul berukuran sedang. Kami menerapkan FermiNet ke molekul yang semakin besar, dari litium hidrida hingga bicyclobutane - ini adalah sistem terbesar yang kami lihat, dengan 30 elektron. Pada molekul terkecil, FermiNet menangkap perbedaan 99,8% yang mencengangkan antara energi cluster terikat dan energi yang berasal dari determinan Slater tunggal. Dalam kasus bicyclobutane, FermiNet masih menangkap 97% atau lebih dari energi korelasi ini - pencapaian besar untuk pendekatan yang seharusnya "murah tapi tidak tepat".dari lithium hidrida menjadi bicyclobutane - ini adalah sistem terbesar yang kami anggap, memiliki 30 elektron. Pada molekul terkecil, FermiNet menangkap perbedaan 99,8% yang mencengangkan antara energi cluster terikat dan energi yang berasal dari determinan Slater tunggal. Dalam kasus bicyclobutane, FermiNet masih menangkap 97% atau lebih dari energi korelasi ini - pencapaian besar untuk pendekatan yang seharusnya "murah tapi tidak tepat".dari lithium hidrida menjadi bicyclobutane - ini adalah sistem terbesar yang kami anggap, memiliki 30 elektron. Pada molekul terkecil, FermiNet menangkap perbedaan 99,8% yang mencengangkan antara energi cluster terikat dan energi yang berasal dari determinan Slater tunggal. Dalam kasus bicyclobutane, FermiNet masih menangkap 97% atau lebih dari energi korelasi ini - pencapaian besar untuk pendekatan yang seharusnya "murah tapi tidak tepat".tapi pendekatan "tidak tepat.tapi pendekatan "tidak tepat.
Gambar 5 adalah representasi grafis dari fraksi energi korelasi yang ditangkap dengan benar oleh FermiNet saat bekerja dengan molekul. Batang ungu menandai 99% energi korelasi. Dari kiri ke kanan: litium hidrida, nitrogen, etilen, ozon, etanol, dan bisiklobutan.
Sementara metode cluster berpasangan bekerja dengan baik dengan molekul stabil, "cutting edge" sebenarnya dari kimia komputasi berkaitan dengan pemahaman bagaimana molekul meregang, memutar, dan pecah. Saat menyelesaikan masalah seperti itu, metode cluster yang terhubung sering gagal, jadi Anda harus membandingkan hasilnya dengan sampel kontrol sebanyak mungkin untuk memastikan jawabannya konsisten. Dalam kerangka eksperimen yang dijelaskan, dua sistem kontrol yang diregangkan dianggap - sebuah molekul nitrogen (N 2) dan rantai hidrogen dari 10 atom (H 10 ). Dalam molekul nitrogen, ikatannya sangat kompleks, karena 3 elektron dari setiap atom berpartisipasi di dalamnya.
Rantai hidrogen, pada gilirannya, menarik untuk memahami sifat apa yang ditunjukkan elektron pada material , misalnya, untuk memprediksi apakah material tertentu akan menghantarkan listrik atau tidak. Di kedua sistem, metode cluster terhubung bekerja dengan baik dalam kesetimbangan, tetapi mengalami kesulitan saat ikatan diregangkan. Metode VMC tradisional tidak bekerja dengan baik di seluruh contoh. Tetapi FermiNet ternyata menjadi salah satu metode terbaik dari semua yang diselidiki, terlepas dari panjang tautan.
Kesimpulan
Kami percaya FermiNet adalah awal dari kemajuan besar dalam sintesis metode pembelajaran mendalam dan kimia kuantum komputasi. Sebagian besar sistem yang sejauh ini telah ditinjau FermiNet telah dipahami dan dipahami dengan baik. Tetapi seperti hasil baik pertama yang menggunakan pembelajaran mendalam di domain lain telah mendorong lonjakan dalam penelitian lebih lanjut dan kemajuan pesat, semoga hal yang sama akan terjadi dengan FermiNet, dan ide untuk arsitektur jaringan saraf baru yang lebih baik akan muncul. Setelah pekerjaan yang dijelaskan telah diposting di arXiv, grup lain membagikan pendekatan mereka untuk menerapkan pembelajaran mendalam untuk memecahkan masalah yang melibatkan banyak elektron. Selain itu, kami baru saja menggali fisika kuantum komputasi dan berencana menggunakan FermiNet untuk memecahkan masalah kompleks di bidang ilmu material dan fisika keadaan padat.
Artikel ilmiah ada di sini , dan kodenya dapat dilihat di sini . Penulis ingin berterima kasih kepada Jim Kinwin, Adam Kine, dan Dominic Barlow atas bantuannya dalam menyiapkan gambar.