Pendahuluan atau AI mana yang saya bicarakan
Saya terutama tertarik pada AI universal sebagai mesin untuk mencapai tujuan yang kompleks. Artinya, semacam kompleks perangkat keras dan perangkat lunak, yang dapat dikatakan: membuat pesawat terbang yang biayanya $ 100, terbang 1000 kilometer dengan kecepatan 800 km / jam dan membawa 5 orang. Atau seperti ini: sembuhkan orang ini dan itu dari kanker pada stadium terminal.
AI harus mampu menangani tugas-tugas seperti itu, jika memungkinkan secara fisik. Dan jika tidak mungkin, maka raih hasil yang sedekat mungkin dengan yang diberikan.
Saat ini, saya melihat dua cara untuk mendapatkan AI universal.
Cara pertama adalah sistem seperti pembelajaran penguatan. Mereka terhubung ke sensor dan aktuator beberapa robot, dan mereka juga memiliki sinyal hadiah. Pembelajaran penguatan (selanjutnya disebut RL) beroperasi untuk menerima rata-rata penghargaan sebanyak mungkin. Dan saluran penghargaan adalah cara utama untuk memberi tahu AI apa yang kami inginkan darinya.
- , GPT-3, . . - , . , … GPT-3 “ - ” - . “ - ” - , . “ ?” GPT-3 , . GPT-3 .
Reinforcement Learning
.
- , RL , , , .
- . , .
,
, RL . - , 224224, , - . , , , , , . , - , , , - , , , . .
. :
1) , . , . ~1000-2000 . , , .
2) . - , “ ”, . , . , “ ”, , .
RL , .
RL . . RL - . - .
, RL . . RL , , .
?
-, RL . , , . - . .
- . RL , . , Doom, , , . RL , . RL - - , , . - - , , - , "" "".
, RL : Doom. .
RL , . , , - Exit.
RL , - , , , , , , Exit. , .
, , .
?
RL . . , .
, RL . , - - .
: RL , . , - , - . , RL - .
: , . , - . , RL , Exit. , “” - - , 5%, . , - , .
. , RL , . , , … : RL , , . , , , , , .
, RL , . . .
, , . - . : . -, . -, , , .
-. - Model-Based . “ ” - , , . ( , ) . , , -.
- , , ->, (, )-> .
.
. , . . RL , . , , , - . , RL , : , , .
, , , , , .
, , . , - RL.
? RL , , . , , . , - .
, . , , - , , . , - , - .
- - . , , .
- , . . , RL .
: ? , ?
: - , , … , .
: , , . , , , . , , , , 110 - , .
?
, : , , ( ). , “” “”.
, , . , , . “ , ”, - .
“ ” - , , . . , . , , . , , , . , -, “” , .
? ?
- . , -, , . , , RL . - , , - .
, . , . , RL “” - , , . ?
, . , - .
, , GAN. ( , - RL) , , . , . “” “” - , , - . .
, RL , - . , .
-
, , . , , , , - , .
, - RL - , . RL, . - - , RL.
RL . ( --) - : , , … , .
, . , , , .
, . , . . - “ ”, .
, , , , , . , , , - .
, RL . , . , RL - , , . , . .
, , , . , , -, . , . : 1000$ 100$ . ? , , . , . , . , - , - - . , , , . , , RL, , , , RL .
- , ( ) - , . , - , . RL - , . , - RL . , .
, , , . , .
, , .
Saya bermaksud artikel ini sebagai cara untuk memancing dialog. Tentunya saya salah di suatu tempat dan ada solusi yang lebih licik daripada yang berhasil saya pikirkan. Komentar yang begitu rinci dan debat yang menarik dipersilahkan!