碰巧的是，到2020年，人们对过程采矿的兴趣激增。远程模式的新现实可能需要更仔细地评估技术和业务流程的效率。与弯曲和倾斜的木制框架相同。它贯穿所有裂缝，仪表发热量达到兆瓦。

通常，对于过程挖掘技术的应用存在一些普遍的要求：

我想改进一些东西，但是除了流行词外，什么都没有听到。
通过优化经典的“从订单到现金”流程等来获取或节省“真钱”；
由我们自己的审核员团队对所有内容进行系统审核；
根据流程指标而非IT指标构建运营分析和监控。

在99％的情况下，他们开始阅读Gartner / Forrester并进入俄罗斯排名前四的供应商（Celonis / Minit / Software AG / UiPath）。在开始获得任何收益之前，他们会立即获得相当可观的许可证价格标签和随后的年度支持。同时，经济理由是用白线缝制的。

真的有必要这样做吗？尤其是当董事自己没有完全理解任务和目标时。不要忘记供应商需要专门准备的事件日志，并且其准备工作可能会导致头痛，并且在传统的企业环境中进行大量的集成工作。

续前期出版物。

前言

仅仅是凡人无法进行过程挖掘吗，一切都令人恐惧且昂贵吗？

不，不，再一次，不。可以使用开源工具关闭90％的生产任务和100％的研究阶段任务。生态系统R几乎可以解决所有问题。此外，即使审计师和人力资源人员也可以掌握这些工具，并在日常活动中有效地使用它们。关于开发人员和分析师，我们能说些什么。

并且当任务很明确时，使用商业工具带来的好处将是合理的，然后您可以考虑购买商业专用软件的许可证。或者相反，关于省钱和减少浪费。

« 1- 30- », R process mining -.

-, , :

(= ) ;
;
;
;
;
.

. , , . , process-mining data-science .

, :

, ETL - ;
2- 3- , «-» ;
« » ;
.

process-mining . data science , , , open-source R Tidyverse. , open-source . 10 , . , process-mining , , process mining office (PMO).

PMO . , data science « », .. () , .

, process-mining , . data science , PMO R tidyverse Excel.

R process mining:

(open-source);
( , );
( 10-100 «» );
( , « »);
( , R > 10 . , /, , , , web , ...).

csv, :

read_csv("./data/pmo/pmo_sales.csv")

xlsx, :

read_excel("./data/pmo/pmo_sales.xlsx", sheet = " ")

: MS SQL, PostgreS, Oracle, MySQL, Access, Redis, Clickhouse,… "Databases using R" (https://db.rstudio.com/)

() . :

mutate — .

df <- read_csv("./data/pmo/pmo_sales.csv") %>%
  #    
  mutate(amount = unitprice * weight)
df

group_by — , summarise — .

#    
df %>% 
  group_by(item) %>%
  summarise(sum(weight), sum(amount))

通过...分组

select — .

df %>%
  select("" = date, ", " = amount, item)

filter — .

df %>%
  filter(amount > 1000, item == "")

arrange — .

df %>%
  arrange(date, desc(amount))

df %>% 
  group_by(item) %>%
  gt(rowname_col = "date")

gp <- ggplot(df, aes(date, amount, color = item, fill = item)) +
  geom_point(size = 4, shape = 19, alpha = 0.7) +
  geom_line(lwd = 1.1) +
  scale_x_date(date_breaks = "1 day", date_minor_breaks = "1 day", date_labels = "%d") +
  scale_y_continuous(breaks = scales::pretty_breaks(10)) +
  ggthemes::scale_color_tableau() +
  ggthemes::scale_fill_tableau() +
  theme_bw()

gp

gp + facet_wrap(~item) + geom_area(alpha = 0.3)

df <- read_csv("./data/pmo/pmo_school.csv")
df

activity resourse

df %>% 
  mutate(new_activity = glue("{activity} - {resource}")) %>%
  count(new_activity, sort = TRUE)

df %>%
  mutate(hr = hour(timestamp), date = as_date(timestamp)) %>%
  group_by(date) %>%
  #    
  filter(timestamp == max(timestamp)) %>%
  ungroup() %>%
  select(date, hr, everything(), -timestamp, -part)

DWG bupaR (https://www.bupar.net)

patients

patients %>%
    process_map()

patients %>%
    process_map(performance(median, "days"))

P.S.

, , . enterprise. .
, «- enterprise : . R»
process mining , Wil M. P. van der Aalst «Process Mining: Data Science in Action». , , .. , .

上一篇- “ Package-Package-Package ...您使用R的效果如何？” ...

如何在企业中用R驯服过程挖掘？

前言

R process mining:

More articles: