Subtitle kriptik di CNN

Pemirsa CNN memperhatikan bahwa dalam buletin berita 12/11/2020 di saluran resmi YouTube mereka, alih-alih teks, ada semacam potongan kata-kata bahasa Inggris yang berantakan, dengan topi terus menerus:





Bagaimana ini bisa terjadi? (Mulai 12/1/2020, subtitel YouTube belum diperbaiki.)



Jenis stenotipe



Selama lebih dari seratus tahun, stenografer Amerika telah menggunakan perangkat khusus dengan keyboard minimal 22 tombol - dua tombol untuk setiap jari untuk meminimalkan gerakan tangan:







Seratus tahun yang lalu, stenotipe adalah versi mesin tik, dan setiap tombol meninggalkan jejak di atas kertas. Tidak ada kereta: setelah setiap "akor" dari satu atau lebih tombol yang ditekan secara bersamaan, kertas digulir ke bawah satu baris. Jejak setiap huruf selalu berada di tempat yang sama di baris. Tombol P, R, S, T hadir dalam duplikat masing-masing - di bawah tangan kiri dan kanan.





Setiap "akor" dan setiap baris pada cetakan sesuai dengan satu suku kata. Tidak ada spasi di antara kata-kata, dan kata-kata itu sendiri dikirim secara fonetik: pada cetakan yang ditunjukkan di atas, frasa "Kamu harus bisa membaca kata-kata pendek ini" ditranskripsikan . Karena ada lebih sedikit kunci daripada huruf dalam alfabet Inggris, dan bahkan lebih banyak daripada suara dalam pidato bahasa Inggris, sistem "pengkodean" yang cerdik digunakan, misalnya [n] ditulis sebagai PB, [l] sebagai HR, diftong [eɪ] sebagai AEU , dll. Dengan pengkodean ini, misalnya, kata berkilau dicatat sebagai TKPWHRAOEPL - «akor" dari sebelas rollover!



Contoh kutipan transkrip sidang pengadilan


Setelah rapat, stenografer harus duduk dan mengetik ulang transkripnya dengan mesin ketik biasa, karena sangat mustahil bagi orang yang tidak siap untuk membacanya. Dalam contoh di atas, frasa “benar-benar seratus persen” ditulis sebagai SHRAOUT HRAOE WOPB HUPBD PERS, yang artinya [sljuːtliː wɒn hʌnd pɛrs] - suku kata yang hilang harus direkonstruksi sesuai dengan konteksnya, dan vokal tidak cukup cocok dengan transkripsi kamus. Ada sistem notasi dan singkatan yang berbeda, sehingga para stenograf sendiri kesulitan membaca catatan satu sama lain. Berikut kutipan singkat dari buku teks singkatan yang diedit oleh pemilik untuk sistem yang berbeda:





Dipercaya bahwa tingkat rata-rata ucapan bahasa Inggris adalah 130 kata per menit, dan stenotipe stenografer dapat mengetik hingga 300 kata per menit, yang memungkinkan Anda merekam percakapan bahkan ketika lawan bicara saling menyela. Ada sistem Velotype serupa , yang berfokus pada huruf demi huruf, bukan fonetik; ini memungkinkan Anda mengetik hingga 200 kata per menit. Perbedaan ini disebabkan oleh fakta bahwa kata dalam bahasa Inggris hampir selalu memiliki lebih banyak huruf daripada bunyi - terkadang dua kali, seperti pada kata pilih [tʃuːz] atau bumi[ɜːθ]. Velotype dibuat pada tahun 1939 ketika tabulator dan pemrosesan data otomatis berkembang pesat; Motivasi untuk menulis huruf demi huruf adalah transkrip yang lebih sederhana yang bahkan dapat digunakan untuk mesin elektromekanis. Bersama dengan peralatan kantor lainnya, mesin stenografik itu sendiri dialiri arus listrik: alih-alih tombol dan huruf yang terhubung secara mekanis di atas kertas, elektronik, pajangan yang nyaman, penyimpanan digital, dan pemrosesan transkrip telah digunakan sejak akhir abad yang lalu.





Pada awal abad ini, kemampuan pemrosesan bahasa alami yang terkomputerisasi mencapai tingkat penguraian otomatis transkrip fonetik stenotipe dan mengubah "SHRAOUT HRAOE" menjadi "mutlak". Kemudian dukungan bagi penyandang disabilitas mencapai tingkat saluran TV yang menyertai siaran langsung dengan subtitle waktu nyata bagi mereka yang merasa lebih mudah membaca daripada mendengarkan. Artinya, siaran tersebut dipantau oleh stenografer dengan stenotipe, ia merekam pidato penyiar dan peserta lain dalam siaran tersebut, komputernya mentranskripsikan transkripnya, jika perlu, secara otomatis menerjemahkannya ke dalam bahasa target audiens, dan mentransmisikan teks yang dihasilkan di udara dan di YouTube.



Rupanya, pada 11/12/2020, ada yang tidak beres dengan CNN dalam sistem yang kompleks ini, dan keluaran pengurai sandi tercampur dengan potongan transkrip yang belum diuraikan. Bahkan jika mereka menemukan kegagalan selama transfer, mereka memutuskan untuk tidak menyentuh apapun, sehingga sesuatu yang lebih penting tidak akan putus. Insiden di Fox News pada tahun 2013 menyebabkan lebih banyak keributan : saat itu, decryptor tidak menangani nama Dzhokhar Tsarnaev , yang menyebabkan ledakan di Boston Marathon, dan mengganti nama aktris Zooey Deschanel di subtitle untuknya .



All Articles