Bagaimana saya, seorang spesialis AI, membeli teks AI

Hari ini saya pergi ke Habr, dan, di bawah secangkir teh, membaca artikel " GPT-3 dari OpenAI dapat menjadi hal terhebat sejak zaman Bitcoin ."



Jika Anda belum membacanya, bacalah. Akhir membangkitkan emosi yang sangat kuat. Bagi saya, mereka diperparah oleh fakta bahwa saya secara relatif terlibat secara profesional dalam AI, pembuatan teks, dan masalah makna - jadi saya cukup yakin bahwa saya dapat dengan mudah mengenali teks yang dihasilkan oleh mesin ...



Ya, ya, saya membelinya. Teks artikel "GPT-3 dari OpenAI bisa jadi yang terhebat karena Bitcoin" (mungkin) dibuat oleh AI, tetapi saya tidak melihatnya, meskipun saya, secara umum, melakukannya secara profesional dan mengetahui teknik dasar yang digunakan di mesin menghasilkan teks.



Setelah syok ringan pertama saya tertidur, saya ingin berbagi sejumlah pertimbangan.



Ini bukan teks mesin, tapi teks yang diproses manusia



Mungkin reaksi pertama terhadap teks tersebut adalah penyangkalan, keengganan untuk menerima bahwa teks ini dibuat oleh mesin. Otak saya mulai dengan kecepatan panik untuk menemukan argumen yang cocok untuk ini. Secara umum, saya sendiri menganggapnya agak lemah, tetapi saya tetap ingin mengutipnya:



  • Tidak diketahui berapa persen dari teks tersebut dan bagaimana penulisnya mengeditnya . Ada contoh teks yang seolah-olah dibuat oleh mesin, tetapi dikoreksi oleh seseorang - misalnya, pernah ada cerita tentang naskah film / buku yang dibuat oleh AI. Kehalusan selalu ada pada detailnya - jika Anda membaca ulasannya, selalu dikatakan sesuatu dalam semangat bahwa AI yang membuat awal cerita, dan kemudian sekelompok penulis menyelesaikannya . Kualitas hasil karyanya selalu saya kaitkan dengan fakta bahwa pengarang hanya membawa sebagian dari makna mereka sendiri dalam finalisasi, karena dalam lukisan abstrak, dengan keinginan yang kuat, Anda dapat menemukan sesuatu . Barangkali argumen ini tidak berhasil di sini, karena menurut jaminan penulis, ia hanya mengoreksi format teks.
  • . , , . , « ?» . , , .
  • . , , . GPT-2, , - . - , , , . , «» GPT-3 , …


Namun, saya juga bersedia mengakui bahwa argumen ini agak lemah, dan mesin tersebut sekarang memang dapat membuat teks berita yang relatif panjang mirip dengan teks manusia.



Saya mengesampingkan cangkir teh saya dan berpikir, “Apa artinya ini? Pelajaran apa yang bisa saya pelajari dari cerita ini? Dapatkah saya sekarang memberikan setidaknya beberapa nasihat tentang kemampuan untuk membedakan teks yang baik dari yang buruk atau yang tidak berarti? "



Lembaga Reputasi dan Pemeriksaan Fakta



Kembali ke emosi yang muncul dalam proses membaca, saya ingat bahwa bagian artikel yang kemudian saya mulai "percaya" pada apa yang terjadi adalah deskripsi percobaan di forum bitcointalk. Awal artikel tidak mengganggu saya - artikel ini membahas fakta tentang pembuatan GPT-3, dan saya sudah terbiasa dengan fakta bahwa fakta tersebut tidak menjelaskan apa pun tentang penulis atau pemahamannya tentang subjek, karena dapat dipinjam dari mana saja.



Tetapi deskripsi eksperimen itu menarik. Sebenarnya, itu menciptakan "konten" artikel - aturan posting, reaksi orang lain dari forum ...



... dan sebagai hasilnya, kami memahami bahwa tidak ada eksperimen.



Ini membawa saya ke pemikiran yang menarik. Saya sudah lama menulis tentang pemodelan siklus bisnis berdasarkan pertumbuhan kepercayaan... Intinya adalah bahwa pertumbuhan hanya terjadi selama kewajiban para pihak terpenuhi - atau, lebih sederhananya, jika saya memberi tahu Anda "Saya akan mengirimkan produk ini kepada Anda dalam seminggu dengan harga X", Anda mempercayai saya, dan saya akan benar-benar melakukannya. Semuanya hanya didasarkan pada kepercayaan - jika Anda tidak mempercayai saya, atau saya akan menipu Anda, kami, tentu saja, dapat mencoba menyelesaikan kasus melalui pengadilan, tetapi ini akan disertai dengan biaya HELLO. Bayangkan bagaimana jadinya jika setiap pembelian yogurt di toko disertai dengan kemungkinan litigasi yang serius ...



Dan di sinilah, menurut pendapat saya, masalah serius dunia modern. Dalam arti tertentu, kita hampir tidak memiliki institusi reputasi yang tersisa sehubungan dengan kata-kata dan teks, yang berarti bahwa kita tidak benar-benar tahu siapa yang dapat kita percayai sama sekali .



Bayangkan perwakilan dari operator selular memanggil Anda. Atau bank. Dengan penawaran baru, unik, dan menguntungkan untuk Anda. Akankah Anda percaya bahwa itu bermanfaat bagi Anda?



Media dapat secara tidak sengaja menempatkan foto yang "salah". Mereka dapat mempertimbangkan situasinya secara sepihak. Posting artikel provokatif di halaman utama dengan tulisan kecil di bagian bawah "Ini adalah kolom penulis. Pendapat penulis mungkin tidak sesuai dengan pendapat dewan editorial. " Mereka bisa merujuk pada profesor tak dikenal dari Institut Dunia di kota Kukuevo dengan kata-kata "Ilmuwan telah menemukan ..." Dan mereka tidak akan mendapatkan apa-apa untuk itu. Paling tidak, mereka akan mengeluh tentang kurangnya pemeriksaan fakta, dan mungkin memposting sanggahan di sudut yang tidak pernah Anda temukan setelah beberapa bulan.



Bahkan kehadiran orang yang "kompeten" tidak membantu. Mungkin, yang paling saya ingat adalah kisah perusahaan Theranos ( di Habré ), yang menjanjikan revolusi hampir medis dan mengumpulkan dewan direksi yang mengesankan (dewan direktur perusahaan termasuk tokoh-tokoh terkenal seperti mantan menteri luar negeri AS Henry Kissinger dan George Schultz). Bagi semua orang, orang-orang seperti itu tampaknya tidak mungkin salah - tetapi pada kenyataannya, mereka juga mengandalkan jaminan verbal, sementara teknologinya, pada kenyataannya, tidak berfungsi. Jangan berpikir bahwa Anda dapat mempercayai sesuatu bahkan jika Anda telah menginvestasikan $ 700 juta di sana.



Sayangnya, intinya sekarang kita tidak bisa lagi mempercayai pendapat orang lain. Reputasi membutuhkan biaya yang sangat sedikit dan dengan senang hati ditukar dengan uang. Faktanya, keluarga dan orang yang kita cintai tetap menjadi satu-satunya ruang kepercayaan yang baik - dan untungnya, ide-ide pemasaran jaringan (Oriflame, dll.), Memanfaatkan kepercayaan pribadi, sedikit banyak telah menghilang dari kehidupan kita.



Tapi kembali ke artikel ... Saya membuat dua kesimpulan untuk diri saya sendiri:



  • . – , / . . , , . , – . . ( , . GPT-2, , , )
  • , . , - « , ; , …». , , – , , .


Kehalusan teks dan dialog



Saya mengumpulkan koleksi teks yang saya hasilkan dan generatornya. Tapi saya tidak terlalu tertarik untuk membahas bagaimana teks dan pemalsuan yang dihasilkan akan mempengaruhi masyarakat - meskipun topik ini mungkin dibayar dengan baik. Bagi saya, setiap contoh teks yang dihasilkan adalah pertanyaan: "Bagian mana dari pemikiran manusia yang dapat kami formalkan?" Dan "apa yang masih belum ditemukan dan masih menjadi hak prerogatif seseorang?"



GPT-3 dan jaringan saraf modern, karena melatih pada teks, dan bukan pada makna yang termasuk dalam teks ini, adalah keturunan jauh dari generasi teks karena jaringan N-gram atau Markov, yang mungkin digunakan di Yandex . Jika Anda melihat prinsip dasar dan contoh teks yang dihasilkan, Anda dapat memperkenalkan beberapa aturan penting:



  • . , . (.) 4-7 , GPT-3, , , . , – , , .
  • . , , , . - , «, » « Apple, , ». , . !
  • . « , , » « , » .


Selain itu, saya ingin menyampaikan secara terpisah tentang dialog dengan AI. Secara khusus, setiap guru tahu bahwa tidak ada yang dapat dikatakan tentang pengetahuannya berdasarkan abstrak yang diberikan oleh siswa. Tetapi jika Anda berbicara dengannya selama 5-10 menit, maka mudah untuk memahami apakah dia "meraba-raba" atau tidak.



Dalam artikel saya tentang chatbots, saya menyebutkan bahwa masalah utama AI saat ini adalah mempertimbangkan konteks dialog dan pemahaman lawan bicaranya.... Sangat mudah untuk membayangkan AI yang merespons frasa tertentu dengan baik - tetapi sepertinya orang yang mendengar sedikit tentang segala hal, tetapi tidak memahami esensinya. Di antara siswa, ada juga yang seperti itu - menanggapi frasa kunci. Jika Anda tidak menyentuh topik yang kompleks, tidak mengevaluasi pengetahuan dan pemahaman pribadi, Anda mungkin merasa bahwa lawan bicaranya adalah seorang intelektual dan tahu apa yang dia bicarakan, meskipun sebenarnya dia hanya mengulangi kebenaran yang dia dengar di suatu tempat .



Manusia jelas tidak ditentukan oleh apa yang dia katakan. Seseorang ditentukan oleh fakta bahwa dia dapat bertindak berdasarkan keyakinannya. Dia dapat menganalisis pengalamannya atau merasakan pengalaman orang lain.



Dia TIDAK secara eksklusif terlibat dalam percakapan, tanpa bertanggung jawab atas kata-katanya.



All Articles