Penambang alfa. Analisis membangun model untuk Proses Mining





Algoritme alfa adalah teknologi analisis proses pertama yang memungkinkan menemukan apa yang disebut jaring Alur Kerja dari log proses. Algoritma ini dikembangkan pada tahun 2013 oleh pendiri metodologi Process Mining, Profesor Will MP van der Aalst.



Yang dimaksud dengan jaring alur kerja (selanjutnya disebut WF) adalah jaringan yang dibangun berdasarkan jaring Petri. Yang penting, WF berdasarkan jaringan Petri memungkinkan Anda untuk menyajikan dan menganalisis lebih lanjut alur kerja.



Ciri khas WF adalah:



  1. . ( , )
  2. ( , )
  3. .1. .2.


Mari kita lihat beberapa contoh:











Skema ini bukan WF. Mengapa? Dalam kasus pertama, kami tidak memiliki awal dan akhir rantai (mereka ditandai dengan lingkaran). Dalam kasus kedua, tindakan d tidak ada akhirnya.



Di bawah ini saya memberikan contoh jaringan WF yang benar - ada awal dan akhir, dan semua tindakan berada di antara mereka dan selesai.







Setelah menjelaskan sedikit tentang apa itu WF,



mari kita lanjutkan ke algoritma alfa: Untuk mendapatkan WF menggunakan algoritma alfa, kita perlu mengatur semuanya dalam log kita. Untuk melakukan ini, kita akan mendefinisikan hubungan berikut antara transisi di event log (nanti mereka akan dibutuhkan untuk membangun model):



1. Urutan langsung.

Peristiwa A> Peristiwa B.

Dalam log peristiwa nyata, akan terlihat seperti ini:







2. Hubungan kausal.

Peristiwa A → Peristiwa B.

Artinya ada transisi seperti itu di log peristiwa







Tetapi tidak ada transisi seperti







itu : Oleh karena itu, pada diagram kami meletakkan simbol







  1. Peristiwa paralel.

    Log berisi transisi Peristiwa A → Peristiwa B dan Peristiwa B → Peristiwa A.
  2. Kurangnya konsistensi.

    Event A # Event B dan sebaliknya. Peristiwa ini tidak muncul di log.


Kumpulan data umum dari semua transisi disebut set L.



Mari kita ambil contoh singkat . Di bawah ini adalah log dari tiga kasus.







Mari tulis koneksi dari log kita yang digunakan dalam algoritme alfa:



  1. > ,

    > ,

    > ,

    > ,

    > ,

    > ,

    >
  2. → ,

    → ,

    → ,

    → ,

    → ,

  3. ||


Berdasarkan hubungan yang diperoleh, kami menggambar WF.







Model yang dihasilkan mencakup semua tindakan log kami dan mudah dianalisis.



Keterbatasan algoritma alfa.



Jika log Anda berisi loop tunggal atau ganda (pengulangan tindakan), algoritme salah menafsirkan dan dapat menghasilkan model yang berbeda dari yang diharapkan. Mari kita kembali ke log sebelumnya dan menambahkan pengulangan:







Model yang diharapkan akan terlihat seperti ini:







Tetapi algoritma alfa akan memberi kita gambaran yang sama sekali berbeda:







Apa alasannya? Tindakan "Memproses aplikasi" tidak memiliki awal atau akhir. Dalam proses menghasilkan model, himpunan A (di mana ada semua permulaan) dan himpunan B (di mana proses diakhiri) dibuat. Karena dengan beberapa pengulangan, kumpulan data menghilang dari kami, algoritme tidak dapat menemukannya. Karenanya, tindakan ini berada di luar model umum.



Situasi yang sama terjadi dengan dua tindakan berulang berturut-turut. Algoritme Alfa hanya akan menyisakan salah satu dari mereka, dan yang kedua akan putus dan kita tidak akan dapat menafsirkan model.



Bagaimana masalah ini diselesaikan? Penting untuk memperhitungkan fitur-fitur sistem yang Anda analisis sebanyak mungkin. Jika sistem Anda menulis ke log tidak hanya poin utama, tetapi juga tindakan yang dihasilkan secara otomatis (misalnya, dalam kasus masukan tulisan tangan, sistem dapat melakukan penyimpanan otomatis setiap 5 detik dan menuliskannya ke log), maka masuk akal untuk menggabungkan tindakan ini menjadi satu elemen.



All Articles