Penulis artikel: Ph.D. S. B. Pshenichnikov, Ph.D. SEBAGAI. Valkov
Aljabar dan bahasa (menulis) adalah dua alat pengetahuan yang berbeda. Jika kita menggabungkannya, maka kita dapat mengandalkan kemunculan metode baru pemahaman mesin. Untuk menentukan arti (memahami) adalah menghitung bagaimana bagian itu berhubungan dengan keseluruhan. Algoritme pencarian modern sudah memiliki tugas pengenalan makna, dan prosesor tensor Google melakukan perkalian matriks (konvolusi) yang diperlukan untuk pendekatan aljabar. Pada saat yang sama, metode statistik terutama digunakan dalam analisis semantik. Dalam aljabar, akan terlihat aneh menggunakan statistik saat mencari, misalnya, untuk tanda-tanda angka yang dapat dibagi. Penggunaan alat aljabar juga berguna untuk menginterpretasikan hasil perhitungan saat mengenali makna suatu teks.
Sebuah teks dipahami sebagai urutan karakter yang sifatnya sewenang-wenang. Misalnya bahasa alam, notasi musik, urutan genetik biopolimer, kode (tabel kode sebagai relasi tanda). Dalam teks musik yang ditulis pada tongkat dari satu baris (tongkat "string"), tanda adalah not, kunci, tanda aliterasi, volume dan tempo. Dalam teks genetik, kata-tanda adalah kembar tiga. Sejauh ini, sistem tanda rasa dan bau hanya ada sebagai yang alami (seperti spesimen, seperti kebun binatang). Untuk sentuhan, ada kode Braille taktil titik bergelombang. Hub sistem tanda adalah semiotika [1] , yang terdiri dari tiga tag: semantik, sintaksis, dan pragmatik.
Contoh teks bahasa:
Himpunan adalah obyek yang merupakan sekumpulan obyek. Polinomial adalah himpunan objek monomial yang merupakan himpunan objek pengali. (satu)
Untuk mengubah teks menjadi objek matematika, Anda perlu mengoordinasikannya dengan benar. Teks contoh dapat dilemmatisasi (jika bentuk morfologi penting untuk tugas, lemmatisasi adalah opsional) - dibawa ke bentuk normal: untuk kata benda, ini adalah kasus nominatif, tunggal; untuk kata sifat - nominatif, tunggal, maskulin; untuk verba, participles, gerunds - kata kerja dalam imperfective infinitive:
()1,1 ()2,2 ()3,3 ()4,4 ()5,1 ()6,3 ("")7,7 ()8,8 ()9,2 ()10,1 ()11,3 ()12,12 ()13,4 ()14,1 ()15,3 ()16,16 ("")17,7 (2)
(2) . () , . – . . , . , (2). «» – ()1,1. ( ) . . . (2) - - 5,1: ()5,1. , – . , , . , . (2) ( ) 1 3. (...)5,5, (...)6,6 . ()5,1 ()6,3.
. ( – – ), . – - ( , ). , – . - «» . . – .
– . – , . , (), . (2) . (2):
()1,1 ()2,2 ()3,3 ()4,4 ("")7,7 ()8,8 ()12,12 ()16,16 (3)
(1) → (2) , , (...)i,j. , . - ·– («» «»), A N. . 24 . ( ) ( ):
, . . () ( ), . - , .
, . . Ei,j ( ) – , i j , . , n=2:
E1,2, E2,1 E1,1, E2,2 ( ). ( ), . , E1,1E2,1=0, E2,1E1,2=E2,2. . , . [2] .
(2) P ( ):
() (2) (5) , P - ( ). () (2) . (2) (5) «» ( -) «-».
(5) ( ) . . .
, (3) :
DR – P . P DR imax×imax, imax – () . P DR , . . DR . .
:
(5) , (2). , (, ), .
, F1, F2, …,Fk , . Fi () Fj (), Fij () , Fi=FijFj. . .
( ). (4) . n2 2(n-1) , (n2 – 2n – 2) – ( ).
– ( ), DR ( ).
– DR ( ), ( ).
, , , (). , , , .
. . .
. F1, F2, …,Fk () Fm , F1, F2, …,Fk Fm .
, . , . . . , . Fm. , Fm, Fm. , , . . . , , . , .
() , , , , .
– P , .
— . : (, , , ); (, , , , – ); ; , ; - (, , , , ).
– () . – -. - - , . ( ), .
(5) :
E – . , (5) (7). (DR+E5,1+E6,3) - . – (DR+E5,1+E6,3) () , ( ).
() (7) :
( ) E5,1 E6,3. E1,1 («») E3,3 («»), . , . . , . , ( ) .
. – (). – (). , – «». : , , . , - «» . – , , «».
DR (6) -. - n- ( -, ). , .
.
() .
– , , , DR. .
- . (, ).
– , . , (8) – ( ) « » « ».
, , , , - , , , ( ). – E8,8+E12,12+E16,16 (7) – ()8,8... ()12,12...()16,16 – F2 F1. () « » « ».
, . , , , ( ), , , .
. – – . – .
Untuk restrukturisasi, diperlukan penataan aljabar korpus teks bahasa untuk menyusun kamus korpus bahasa tersebut di atas. Dalam hal ini, cita-cita dan kelas residu cincin matriks P txt dari korpus teks matriks harus dibangun dan diselidiki sebelumnya.
Penjelasan yang lebih ketat dan umum tentang aljabar suatu teks diberikan dalam [3] .