如何在企业中用R驯服过程挖掘?

碰巧的是,到2020年,人们对过程采矿的兴趣激增。远程模式的新现实可能需要更仔细地评估技术和业务流程的效率。与弯曲和倾斜的木制框架相同。它贯穿所有裂缝,仪表发热量达到兆瓦。



通常,对于过程挖掘技术的应用存在一些普遍的要求:



  • 我想改进一些东西,但是除了流行词外,什么都没有听到。
  • 通过优化经典的“从订单到现金”流程等来获取或节省“真钱”;
  • 由我们自己的审核员团队对所有内容进行系统审核;
  • 根据流程指标而非IT指标构建运营分析和监控。


在99%的情况下,他们开始阅读Gartner / Forrester并进入俄罗斯排名前四的供应商(Celonis / Minit / Software AG / UiPath)。在开始获得任何收益之前,他们会立即获得相当可观的许可证价格标签和随后的年度支持。同时,经济理由是用白线缝制的。



真的有必要这样做吗?尤其是当董事自己没有完全理解任务和目标时。不要忘记供应商需要专门准备的事件日志,并且其准备工作可能会导致头痛,并且在传统的企业环境中进行大量的集成工作。



前期出版物



前言



仅仅是凡人无法进行过程挖掘吗,一切都令人恐惧且昂贵吗?

不,不,再一次,不。可以使用开源工具关闭90%的生产任务和100%的研究阶段任务。生态系统R几乎可以解决所有问题。此外,即使审计师和人力资源人员也可以掌握这些工具,并在日常活动中有效地使用它们。关于开发人员和分析师,我们能说些什么。



并且当任务很明确时,使用商业工具带来的好处将是合理的,然后您可以考虑购买商业专用软件的许可证。或者相反,关于省钱和减少浪费。



« 1- 30- », R process mining -.



.





-, , :



  • (= ) ;
  • ;
  • ;
  • ;
  • ;
  • .


:





. , , . , process-mining data-science .



, :



  • , ETL - ;
  • 2- 3- , «-» ;
  • « » ;
  • .




process-mining . data science , , , open-source R Tidyverse. , open-source . 10 , . , process-mining , , process mining office (PMO).



PMO . , data science « », .. () , .



, process-mining , . data science , PMO R tidyverse Excel.



R process mining:



  • (open-source);
  • ( , );
  • ( 10-100 «» );
  • ( , « »);
  • ( , R > 10 . , /, , , , web , ...).




csv, :



read_csv("./data/pmo/pmo_sales.csv")




xlsx, :



read_excel("./data/pmo/pmo_sales.xlsx", sheet = " ")




: MS SQL, PostgreS, Oracle, MySQL, Access, Redis, Clickhouse,… "Databases using R" (https://db.rstudio.com/)





() . :





mutate — .



df <- read_csv("./data/pmo/pmo_sales.csv") %>%
  #    
  mutate(amount = unitprice * weight)
df


变异



group_by — , summarise — .



#    
df %>% 
  group_by(item) %>%
  summarise(sum(weight), sum(amount))


通过...分组



select — .



df %>%
  select("" = date, ", " = amount, item)


选择



filter — .



df %>%
  filter(amount > 1000, item == "")


过滤



arrange — .



df %>%
  arrange(date, desc(amount))


安排





df %>% 
  group_by(item) %>%
  gt(rowname_col = "date")






gp <- ggplot(df, aes(date, amount, color = item, fill = item)) +
  geom_point(size = 4, shape = 19, alpha = 0.7) +
  geom_line(lwd = 1.1) +
  scale_x_date(date_breaks = "1 day", date_minor_breaks = "1 day", date_labels = "%d") +
  scale_y_continuous(breaks = scales::pretty_breaks(10)) +
  ggthemes::scale_color_tableau() +
  ggthemes::scale_fill_tableau() +
  theme_bw()

gp






gp + facet_wrap(~item) + geom_area(alpha = 0.3)








df <- read_csv("./data/pmo/pmo_school.csv")
df




activity resourse



df %>% 
  mutate(new_activity = glue("{activity} - {resource}")) %>%
  count(new_activity, sort = TRUE)




?



df %>%
  mutate(hr = hour(timestamp), date = as_date(timestamp)) %>%
  group_by(date) %>%
  #    
  filter(timestamp == max(timestamp)) %>%
  ungroup() %>%
  select(date, hr, everything(), -timestamp, -part)




DWG bupaR (https://www.bupar.net)



.



patients






patients %>%
    process_map()


耐心





patients %>%
    process_map(performance(median, "days"))




P.S.



  1. , , . enterprise. .
  2. , «- enterprise : . R»
  3. process mining , Wil M. P. van der Aalst «Process Mining: Data Science in Action». , , .. , .


上一篇- “ Package-Package-Package ...您使用R的效果如何?” ...




All Articles