Pengakuan dokumen pada contoh pribadi - gambaran umum solusi berbayar dan gratis yang tersedia

Halo! Ini adalah situasi yang khas di perusahaan tempat saya bekerja. Dalam akuntansi, ada kesibukan abadi, tidak ada cukup banyak orang, semua orang melakukan sesuatu yang sangat penting, tetapi pada dasarnya tidak berguna. Keadaan ini tidak sesuai dengan manajemen.



Secara lebih rinci, masalahnya adalah bahwa sumber daya akuntansi tidak cukup untuk tugas saat ini, dan tidak ada yang mau mengalokasikan tarif untuk orang baru. Oleh karena itu, dari atas, mereka memutuskan untuk memotong beberapa tugas dan membebaskan waktu akuntan untuk hal-hal yang lebih berguna. Pekerjaan seperti memindai dan mengenali dokumen, menyalin, menambahkannya ke kesenangan rutin lainnya berada di bawah pisau.



Jadi, sebagai seorang analis, saya dihadapkan pada tugas untuk menemukan solusi untuk mengenali dokumen yang khas untuk perusahaan saya - faktur - untuk menyusunnya menjadi fasilitas penyimpanan yang tersedia, serta dalam 1C. Sebuah solusi yang nyaman, dapat dimengerti, dan tidak akan membebani perusahaan dengan biaya yang besar.



Pengalaman itu ternyata lucu, saya memutuskan untuk membagikan apa yang berhasil saya kumpulkan. Mungkin saya melewatkan sesuatu, jadi selamat datang di komentar, jika ada yang ingin ditambahkan.





Program pemindaian dokumen, program pengenalan dokumen bukanlah solusi baru di pasar, itu dapat ditemukan baik dalam program gratis dan dibangun ke dalam sistem.



Saya mulai dengan program gratis:



  • glmageReader
  • Dokumen
  • VietOCR
  • Runcing.


Selama pengakuan faktur kami oleh program semacam itu, saya melihat yang berikut:



  • Dalam program seperti VietOCR, Paperwork, glmageReader, Anda dapat mengkonfigurasi penyimpanan dokumen yang dipindai di folder tertentu, Paperwork bahkan dapat mengurutkannya sesuai dengan label.
  • Mereka umumnya bekerja dengan baik dengan teks, dan ketika teks tidak dikenali dengan benar, beberapa program dapat mengubah konten secara manual sebelum mengekspor file.


gambar



Namun, ada juga masalah:



  • Ada perbedaan antara bekerja dengan pindaian pdf dan png. Tidak selalu mungkin berhasil mengonversi png ke pdf.
  • Sebagian besar program ini sulit ditangani dengan pengenalan dokumen tabel, bahkan dalam format yang paling sederhana. Hasilnya, kami mendapatkan teks yang dikenali tanpa bidang yang ditandai.



    gambar

  • Terkadang font ditentukan secara tidak akurat, akibatnya, saat mengonversi, semua teks yang dikenali berjalan di atas satu sama lain.
  • Dalam proses pengenalan terkadang perlu dilakukan penyelarasan berdasarkan kata kunci, dengan rotasi dan perpindahan koordinat.
  • Di beberapa program, tabel dikenali sebagai gambar dan diekspor ke dokumen Word baru juga sebagai gambar, sangat terpotong, yang bahkan sulit dilihat.
  • Saat mengedit konten yang dikenali di beberapa program, masalah muncul, font atau teks itu sendiri berubah.




gambar



Teknologi tersebut bekerja dengan cukup baik, mengingat programnya gratis, masalah yang dijelaskan di atas dapat diterima. Namun, saya mencari solusi yang lebih efisien.



Kemudian saya meneliti pengakuan di ABBYY FineReader 15 Corporate



Selama masa uji coba 7 hari, saya mempelajari platform ini juga.



Apa yang dicatat:



  • Ketika saya membuka file png, terbaca dengan sempurna dan hasilnya berhasil dikonversi ke pdf tanpa kehilangan kualitas gambar dan teks.
  • , . png , .
  • - pdf. .
  • , , .
  • OCR pdf -. - .



    gambar

  • , , . , , .



    gambar

  • Di sini Anda dapat mengonfigurasi konversi otomatis dokumen masuk yang secara teratur akan ditarik dari folder yang ditentukan, sesuai dengan jadwal yang ditentukan.
  • Ini memungkinkan Anda untuk membandingkan versi dokumen, meskipun dalam format yang berbeda. Dengan aliran besar dokumen dan pengeditan di dalamnya, sangat nyaman.


Saya memiliki pengalaman yang menyenangkan menggunakan software ini. Namun, ketika saya beralih ke label harga solusi sistem ABBYY Flexicapture (dan saya membutuhkan solusi sistem), saya menemukan bahwa solusinya, terutama yang disesuaikan, harganya cukup mahal, sekitar 400 ribu rubel / bulan. dan di atasnya untuk 10 ribu halaman.



Saya mulai mencari alternatif. Cara membebaskan tangan karyawan, mendapatkan pengenalan dokumen berkualitas tinggi, dan tidak mengkhawatirkan keamanan dan struktur data.



Dan kemudian saya memutuskan untuk melihat ELMA RPA dengan lebih baik, yang telah saya pelajari sebelumnya .



Vendor mengusulkan untuk mengalihkan sebagian besar pekerjaan ekspor data ke ERP dari bahu akuntan ke robot. Faktanya, inilah yang memecahkan masalah yang diajukan kepada saya. Untuk mengenal pengenalan dalam sistem ini, saya mengambil versi uji coba sistem dari vendor.



Di sini saya menemukan bahwa pengenalan tidak dimaksudkan untuk mengubah data yang diterima menjadi file dokumen baru.



Di sini tujuan utamanya adalah untuk mengenali detail dokumen dan mentransfernya ke sistem / situs / aplikasi lain. Selain itu, robot menempatkan semua informasi di tempat yang tepat: mereka secara otomatis menemukan folder yang tepat dan menyimpannya dalam format yang diperlukan.



Jenis pengenalan apa dalam sistem yang telah saya lihat:



Pengenalan pola



Kami ditawarkan untuk mengenali dokumen yang dimuat berdasarkan template dokumen. Sejauh yang saya tahu, jenis pengenalan ini gratis, mesin Tesseract disambungkan ke dalamnya.



Apa yang dicatat:



  • Jenis pengenalan ini bekerja dengan pindaian dalam format jpg dan png, belum mempertimbangkan pdf. Tapi produknya masih muda, saya pikir semuanya ada di depan.
  • Jenis pengakuan ini termasuk dalam Edisi Komunitas gratis
  • Teks dengan mudah ditandai dalam blok yang dapat dicocokkan sesuai dengan variabel yang kita buat dalam konteks robot. Jadi, konfigurasikan secara manual apa yang sebenarnya kita tarik ke dalam pengenalan.
  • Dia mengenali faktur kami 50/50, mengubah beberapa kata sesuai keinginannya. :)



    gambar





Namun, vendor untuk kasus ini mengatakan bahwa jenis pengenalan ini disesuaikan untuk dokumen sederhana, dengan struktur teks atau dengan bentuk yang ringan. Dan dia menyarankan untuk menggunakan jenis pengakuan lain untuk mengenali faktur - lab kecerdasan .



Prosesnya sama, kami memuat template dan mengenalinya. Tapi di sini template dikirim ke server cloud.



Kami menerima respons dari server (apakah itu mengenali jenis dokumen ini atau tidak), dan jika dikenali, maka struktur template (variabel untuk pemetaan) diteruskan agar sesuai dengan variabel yang perlu ditulis dalam proses RPA.



Selama proses pemutaran, kami sudah mengirim dokumen yang ingin kami kenali dan menerima respons dari server iLab tentang pengenalan.



Apa yang saya catat tentang pengakuan ini:



  • pdf, jpg png.
  • . .
  • - .
  • , 1. , , , , .
  • Community Edition . , (, , .), , 100 500 . ( , , .)


Proses pengenalan dokumen sendiri agak sulit untuk ditampilkan di video, karena terjadi di dalam kotak, dan layar kosong selama beberapa detik. Oleh karena itu, saya membuat entri terpisah dari data yang dikenali ke dalam buku catatan untuk visualisasi.



Mengenali dokumen di notepad



Karenanya, robot menulis data yang sama ke 1C, membuat dokumen baru di sana:



pengenalan dan pembuatan dokumen dalam 1C



Apa yang berhasil kami temukan berdasarkan harga: Jika, misalnya, kami ingin bekerja dalam skala besar dengan pengenalan ilab, maka untuk 10.000 dokumen kami, kami harus membayar:



  • sekitar 180.000 rubel. pada suatu waktu,
  • ditambah, katakanlah, 400.000 rubel. membeli robot dengan orkestra
  • total: 580.000 rubel.


Robot ini tidak terbatas, dan 10.000 dokumen sudah cukup untuk beberapa waktu. Ternyata cukup menguntungkan, setidaknya dalam kenyataan bahwa kami membayar semuanya sekali.



Apa yang kami suka tentang pengakuan di platform ini secara umum:



  • , , . .
  • , , , . .
  • . 15 , — . , .
  • , .


:



  • Program gratis menangani tugas pengenalan dokumen lebih baik dari yang saya harapkan, namun, karena mereka, tidak mungkin mempercepat pekerjaan secara signifikan dengan volume besar
  • ABBYY FineReader mengatasi dengan baik pemrosesan dan pengenalan dokumen setelahnya, namun, untuk mendapatkan solusi sistem, Anda memerlukan kemampuan finansial yang hebat.
  • ELMA RPA terkejut dengan kualitas pengenalan dokumen, variabilitas, serta kemampuan penyimpanan dan transfer setelah pengenalan, tetapi harus diingat bahwa produk tersebut masih muda.



All Articles