Entah bagaimana, pada tahun 2020 ada lonjakan minat pada subjek Penambangan Proses. Ada kemungkinan bahwa realitas baru dari mode jarak jauh membutuhkan penilaian yang lebih dekat terhadap efektivitas proses teknologi dan bisnis. Ini sama dengan bingkai kayu yang melengkung dan miring. Ini mengalir melalui semua celah, dan meterannya memutar megawatt untuk pemanasan.
Secara umum, ada beberapa permintaan populer untuk penerapan teknologi penambangan proses:
- Saya ingin meningkatkan sesuatu, tetapi belum mendengar apa pun selain kata kunci;
- dapatkan atau simpan "uang nyata" dengan mengoptimalkan proses klasik "pesan-ke-tunai" dan sejenisnya;
- audit sistem atas segala sesuatu dan segalanya oleh tim auditor kami sendiri;
- membangun analitik operasional dan pemantauan berdasarkan indikator proses, bukan metrik TI.
Dalam 99% kasus, mereka mulai membaca Gartner / Forrester dan mendapatkan 4 vendor teratas (Celonis / Minit / Software AG / UiPath), yang entah bagaimana ada di Rusia. Dan sebelum mereka mulai menerima manfaat apa pun, mereka segera menerima label harga yang cukup besar untuk lisensi dan dukungan tahunan berikutnya. Pada saat yang sama, pembenaran ekonomi dijahit dengan benang putih.
Apakah benar-benar perlu melalui cara ini? Apalagi bila tugas dan tujuannya tidak sepenuhnya dipahami oleh direksi itu sendiri. Jangan lupa bahwa vendor memerlukan log peristiwa yang disiapkan secara khusus, dan persiapannya dapat menimbulkan sakit kepala dan pekerjaan integrasi selama berbulan-bulan dalam lanskap perusahaan klasik.
Lanjutan dari publikasi sebelumnya .
Pembukaan
process mining ?
, . 90% 100% open-source . R . HR . .
, , . , .
« 1- 30- », R process mining -.
-, , :
- (= ) ;
- ;
- ;
- ;
- ;
- .
:

. , , . , process-mining data-science .
, :
- , ETL - ;
- 2- 3- , «-» ;
- « » ;
- .
process-mining . data science , , , open-source R Tidyverse. , open-source . 10 , . , process-mining , , process mining office (PMO).
PMO . , data science « », .. () , .
, process-mining , . data science , PMO R tidyverse Excel.
R process mining:
- (open-source);
- ( , );
- ( 10-100 «» );
- ( , « »);
- ( , R > 10 . , /, , , , web , ...).
csv, :
read_csv("./data/pmo/pmo_sales.csv")

xlsx, :
read_excel("./data/pmo/pmo_sales.xlsx", sheet = " ")

: MS SQL, PostgreS, Oracle, MySQL, Access, Redis, Clickhouse,… "Databases using R" (https://db.rstudio.com/)
() . :
mutate — .
df <- read_csv("./data/pmo/pmo_sales.csv") %>%
#
mutate(amount = unitprice * weight)
df

group_by — , summarise — .
#
df %>%
group_by(item) %>%
summarise(sum(weight), sum(amount))

select — .
df %>%
select("" = date, ", " = amount, item)

filter — .
df %>%
filter(amount > 1000, item == "")

arrange — .
df %>%
arrange(date, desc(amount))

df %>%
group_by(item) %>%
gt(rowname_col = "date")

gp <- ggplot(df, aes(date, amount, color = item, fill = item)) +
geom_point(size = 4, shape = 19, alpha = 0.7) +
geom_line(lwd = 1.1) +
scale_x_date(date_breaks = "1 day", date_minor_breaks = "1 day", date_labels = "%d") +
scale_y_continuous(breaks = scales::pretty_breaks(10)) +
ggthemes::scale_color_tableau() +
ggthemes::scale_fill_tableau() +
theme_bw()
gp

gp + facet_wrap(~item) + geom_area(alpha = 0.3)

df <- read_csv("./data/pmo/pmo_school.csv")
df

activity resourse
df %>%
mutate(new_activity = glue("{activity} - {resource}")) %>%
count(new_activity, sort = TRUE)

?
df %>%
mutate(hr = hour(timestamp), date = as_date(timestamp)) %>%
group_by(date) %>%
#
filter(timestamp == max(timestamp)) %>%
ungroup() %>%
select(date, hr, everything(), -timestamp, -part)

DWG bupaR (https://www.bupar.net)
.
patients

patients %>%
process_map()

patients %>%
process_map(performance(median, "days"))

P.S.
- , , . enterprise. .
- , «- enterprise : . R»
- process mining , Wil M. P. van der Aalst «Process Mining: Data Science in Action». , , .. , .
Posting sebelumnya - "Package-Package-Package ... Seberapa Efektif Apakah Anda Menggunakan R?" ...