Bagaimana kami mencari sensor yang rusak di URALCHEM (proyek Data Lake pertama)

gambar



URALCHEM membuat pupuk. No. 1 di Rusia - untuk produksi amonium nitrat, misalnya, ada di 3 besar produsen dalam negeri amonia, urea, pupuk nitrogen. Asam sulfat, pupuk dua-tiga komponen, fosfat dan banyak lagi diproduksi. Semua ini menciptakan lingkungan yang agresif di mana sensor gagal.



Kami membangun Data Lake dan pada saat yang sama mencari sensor yang membeku, gagal, mulai memberikan data palsu dan umumnya berperilaku berbeda dari yang seharusnya dilakukan oleh sumber informasi. Dan "triknya" adalah tidak mungkin membangun model matematika dan digital twins berdasarkan data "buruk": mereka tidak akan menyelesaikan masalah dengan benar dan memberikan efek bisnis.



Tetapi pabrik modern membutuhkan Data Lake untuk ilmuwan data. Dalam 95% kasus, data "mentah" tidak dikumpulkan dengan cara apa pun, tetapi hanya agregat dalam sistem kontrol proses yang diperhitungkan, yang disimpan selama dua bulan dan poin "perubahan dalam dinamika" indikator disimpan, yang dihitung dengan algoritme yang ditetapkan secara khusus, yang bagi ilmuwan data mengurangi kualitas data, karena ., mungkin, mungkin melewatkan "semburan" indikator ... Sebenarnya, sesuatu seperti itu terjadi di URALCHEM. Itu perlu untuk membuat gudang data produksi, mengambil sumber di toko dan di sistem MES / ERP. Pertama-tama, ini diperlukan untuk mulai mengumpulkan sejarah untuk ilmu data. Kedua, agar data scientist memiliki platform untuk kalkulasi mereka dan sandbox untuk menguji hipotesis, dan tidak memuat yang sama di mana sistem kontrol proses berputar.Ilmuwan Data mencoba menganalisis data yang tersedia, tetapi ini tidak cukup. Data disimpan hancur, dengan kerugian, sering tidak sesuai dengan sensor. Tidak mungkin mengambil kumpulan data dengan cepat, dan tidak ada tempat untuk bekerja dengannya juga.



Sekarang mari kita kembali ke apa yang harus dilakukan jika sensor "bergerak".



Saat Anda membangun danau



Tidak cukup hanya dengan membangun sesuatu seperti itu:



gambar



Anda juga perlu membuktikan kepada bisnis bahwa semuanya berhasil, dan menunjukkan contoh dari satu proyek yang sudah selesai. Jelas bahwa melakukan satu proyek dengan gabungan semacam itu adalah tentang bagaimana membangun komunisme di satu negara, tetapi syaratnya persis seperti itu. Kami mengambil mikroskop dan membuktikan bahwa mereka dapat memasang paku.



Secara global, URALCHEM ditugaskan untuk mendigitalkan produksi. Sebagai bagian dari semua tindakan ini, pertama-tama, buat kotak pasir untuk menguji hipotesis, meningkatkan efisiensi proses produksi, serta mengembangkan model prediksi kegagalan peralatan, sistem pendukung keputusan, dan dengan demikian mengurangi jumlah waktu henti dan meningkatkan kualitas proses produksi. Ini adalah saat Anda mengetahui sebelumnya bahwa ada sesuatu yang akan gagal, dan Anda dapat memperbaikinya seminggu sebelum mesin mulai menghancurkan segala sesuatu di sekitarnya. Manfaat - dalam mengurangi biaya produksi dan meningkatkan kualitas produk.



Ini adalah bagaimana kriteria platform dan persyaratan dasar untuk uji coba muncul: menyimpan sejumlah besar informasi, akses online ke data dari sistem intelijen bisnis, penghitungan yang mendekati waktu nyata untuk mengeluarkan rekomendasi atau pemberitahuan sesegera mungkin.



Kami mengerjakan opsi integrasi dan menyadari bahwa untuk kinerja dan operasi dalam mode NRT, Anda hanya perlu bekerja melalui konektor Anda, yang akan menambahkan data ke Kafka (broker pesan yang dapat diskalakan secara horizontal yang memungkinkan Anda untuk "berlangganan ke acara" mengubah pembacaan sensor, dan berdasarkan acara ini dengan cepat untuk membuat perhitungan dan menghasilkan pemberitahuan). Omong-omong, Artur Khismatullin, kepala departemen pengembangan sistem produksi, cabang OTSO URALCHEM JSC, banyak membantu kami.



Apa yang dibutuhkan, misalnya, untuk membuat model prediksi kegagalan peralatan?



Ini membutuhkan telemetri dari setiap node secara real time atau dalam irisan yang dekat dengannya. Artinya, tidak sekali satu jam merupakan status umum, tetapi secara langsung pembacaan spesifik dari semua sensor untuk setiap detik.



Tidak ada yang mengumpulkan atau menyimpan data ini. Selain itu, kami membutuhkan data historis setidaknya selama enam bulan, dan dalam sistem kontrol proses, seperti yang saya katakan, disimpan maksimal tiga bulan terakhir. Artinya, Anda harus mulai dengan fakta bahwa data akan dikumpulkan dari suatu tempat, ditulis di suatu tempat, dan disimpan di suatu tempat. Data sekitar 10 GB per node per tahun.



Selanjutnya, Anda harus bekerja dengan data ini. Ini membutuhkan instalasi yang memungkinkan Anda untuk membuat pilihan dari database secara normal. Dan diinginkan bahwa di join'ah yang kompleks semuanya tidak bangun selama sehari. Apalagi nanti, ketika produksi mulai menambah lebih banyak masalah dalam memprediksi pernikahan. Nah, untuk perbaikan prediktif, juga, laporan malam bahwa mesin mungkin rusak saat mogok setengah jam yang lalu - biasa saja.



Alhasil, danau itu dibutuhkan para ilmuwan data.



Tidak seperti solusi serupa lainnya, kami masih memiliki tugas real-time di Hadoop. Karena tugas besar berikutnya adalah data komposisi bahan, analisis kualitas zat, konsumsi bahan produksi.



Sebenarnya, ketika kami membangun platform itu sendiri, hal berikutnya yang diinginkan bisnis dari kami adalah kami mengumpulkan data tentang kegagalan sensor dan membangun sistem yang memungkinkan kami mengirim pekerja untuk mengubahnya atau menyervisnya. Dan pada saat yang sama menandai kesaksian mereka sebagai salah dalam sejarah.



Sensor



Dalam produksi - lingkungan yang agresif, sensor bekerja dengan cara yang sulit dan seringkali gagal. Idealnya, sistem pemantauan prediktif juga diperlukan untuk sensor, tetapi pertama-tama, setidaknya penilaian mana yang berbohong dan mana yang tidak.



Ternyata, bahkan model sederhana untuk menentukan apa yang ada di sana dengan sensor sangat penting untuk tugas lain - membangun keseimbangan matematis. Perencanaan proses yang tepat - berapa banyak dan apa yang perlu dimasukkan, bagaimana memanaskannya, bagaimana mengolahnya: jika perencanaannya salah, maka tidak jelas berapa banyak bahan baku yang dibutuhkan. Produk yang akan diproduksi tidak mencukupi - perusahaan tidak akan mendapat untung. Jika ada lebih dari yang diperlukan - lagi kerugian, karena Anda perlu menyimpan. Keseimbangan material yang benar hanya dapat diperoleh dari informasi yang benar dari sensor.



Jadi, dalam proyek percontohan kami, pemantauan kualitas data produksi dipilih.



Kami duduk bersama para ahli teknologi untuk data "mentah", melihat kegagalan peralatan yang dikonfirmasi. Dua alasan pertama sangat sederhana.



Di sini sensor tiba-tiba mulai menampilkan data yang, pada prinsipnya, seharusnya tidak:



gambar



Kemungkinan besar, puncak lokal ini adalah saat sensor menjadi buruk secara termal atau kimiawi.



Ada juga yang melampaui batas pengukuran yang diizinkan (bila ada kuantitas fisik seperti suhu air dari 0 hingga 100). Pada titik nol, air tidak bergerak melalui sistem, dan pada 200 itu adalah uap, dan kami akan melihat fakta ini dengan tidak adanya atap di atas bengkel.



Kasus kedua juga hampir sepele:



gambar



Data dari sensor tidak berubah selama beberapa menit berturut-turut - ini tidak terjadi dalam produksi langsung. Kemungkinan besar sesuatu dengan perangkat.



80% masalah ditutup dengan melacak pola ini tanpa Big Data, korelasi, dan riwayat data. Tetapi untuk akurasi yang lebih tinggi dari 99%, Anda perlu menambahkan perbandingan lain dengan sensor lain di node tetangga, khususnya, sebelum dan sesudah bagian dari mana telemetri meragukan datang:



gambar



Produksi adalah sistem yang seimbang: jika satu indikator berubah, maka yang lain juga harus berubah. Dalam kerangka proyek, aturan dibentuk tentang hubungan indikator, dan hubungan ini "dinormalisasi" oleh ahli teknologi. Berdasarkan pedoman ini, sistem berbasis Hadoop dapat mengidentifikasi sensor yang berpotensi tidak beroperasi.



Operator pabrik senang bahwa sensor tersebut dideteksi dengan benar, karena ini berarti mereka dapat dengan cepat mengirimkan tukang reparasi atau hanya membersihkan sensor yang diinginkan.



Sebenarnya, pilot akhirnya membuat daftar sensor yang berpotensi tidak berfungsi di toko yang menunjukkan informasi yang salah.



Anda mungkin bertanya bagaimana tanggap darurat dan kondisi pra-darurat dilaksanakan sebelumnya, dan bagaimana jadinya setelah proyek. Saya akan menjawab bahwa reaksi terhadap kecelakaan tidak melambat, karena dalam situasi seperti itu beberapa sensor menunjukkan masalah sekaligus.



Baik ahli teknologi atau kepala departemen bertanggung jawab atas efisiensi instalasi (dan tindakan jika terjadi kecelakaan). Mereka sangat memahami apa dan bagaimana yang terjadi dengan peralatan mereka, dan tahu bagaimana mengabaikan beberapa sensor. Sistem kontrol proses yang menyertai instalasi bertanggung jawab atas kualitas data. Dalam situasi normal, ketika sensor rusak, itu tidak dialihkan ke mode siaga. Untuk teknolog, dia tetap seorang pekerja; teknolog harus bereaksi. Ahli teknologi memeriksa kejadian tersebut dan menemukan bahwa tidak ada yang terjadi. Ini terlihat seperti ini: "Kami hanya menganalisis dinamika, kami tidak melihat yang absolut, kami tahu bahwa mereka salah, kami perlu menyesuaikan sensor." Kami "menyoroti" ke spesialis sistem kontrol proses otomatis bahwa sensor salah dan di mana salah. Sekarang, alih-alih putaran formal yang direncanakan, dia pertama memperbaiki perangkat tertentu dengan cara yang ditargetkan, dan kemudian dia membuat putaran, tidak mempercayai teknologinya.



Untuk memperjelas berapa lama perjalanan yang direncanakan, saya hanya akan mengatakan bahwa ada tiga hingga lima ribu sensor di masing-masing lokasi. Kami telah memberikan alat analitik komprehensif yang menyediakan data yang diproses, yang menjadi dasarnya spesialis perlu membuat keputusan tentang verifikasi. Berdasarkan pengalamannya, kami β€œmenyoroti” dengan tepat apa yang dibutuhkan. Anda tidak perlu lagi memeriksa setiap sensor secara manual, dan kemungkinan ada sesuatu yang terlewat akan berkurang.



Apa hasilnya



Menerima konfirmasi bisnis bahwa tumpukan dapat digunakan untuk memecahkan masalah produksi. Kami menyimpan dan memproses data situs. Bisnis sekarang harus memilih proses berikut untuk data scientist untuk beroperasi. Sementara mereka menunjuk orang yang bertanggung jawab atas kontrol kualitas data, tulis peraturan untuknya dan terapkan ini ke dalam proses produksi mereka.



Beginilah cara kami menerapkan kasus ini:



gambar



Dasbor terlihat seperti ini: Dasbor ditampilkan



gambar



gambar



di tempat seperti ini:



gambar



Apa yang kami miliki:



  • ruang informasi dibuat pada tingkat teknologi untuk bekerja dengan pembacaan dari sensor peralatan;
  • memverifikasi kemampuan untuk menyimpan dan memproses data berdasarkan teknologi Big Data;
  • menguji kemampuan sistem intelijen bisnis (misalnya, Power BI) untuk bekerja dengan data lake yang dibangun di atas platform Arenadata Hadoop;
  • penyimpanan analitik terpadu diperkenalkan untuk mengumpulkan informasi produksi dari sensor peralatan dengan kemungkinan penyimpanan informasi jangka panjang (volume akumulasi data yang direncanakan untuk tahun tersebut sekitar dua terabyte);
  • mekanisme dan metode untuk memperoleh data dalam mode hampir waktu-nyata telah dikembangkan;
  • algoritma untuk menentukan penyimpangan dan operasi sensor yang salah dalam mode Near real time (perhitungan - sekali satu menit) telah dikembangkan;
  • pengujian operasi sistem dan kemungkinan menghasilkan laporan di alat BI dilakukan.


Intinya adalah kami telah menyelesaikan masalah produksi sepenuhnya - kami telah mengotomatiskan proses rutin. Kami memberikan alat perkiraan dan memberi waktu luang bagi para ahli teknologi untuk memecahkan masalah yang lebih cerdas.



Dan jika Anda masih memiliki pertanyaan bukan untuk komentar, maka inilah emailnya - chemistry@croc.ru



All Articles