碰巧的是,到2020年,人们对过程采矿的兴趣激增。远程模式的新现实可能需要更仔细地评估技术和业务流程的效率。与弯曲和倾斜的木制框架相同。它贯穿所有裂缝,仪表发热量达到兆瓦。
通常,对于过程挖掘技术的应用存在一些普遍的要求:
- 我想改进一些东西,但是除了流行词外,什么都没有听到。
- 通过优化经典的“从订单到现金”流程等来获取或节省“真钱”;
- 由我们自己的审核员团队对所有内容进行系统审核;
- 根据流程指标而非IT指标构建运营分析和监控。
在99%的情况下,他们开始阅读Gartner / Forrester并进入俄罗斯排名前四的供应商(Celonis / Minit / Software AG / UiPath)。在开始获得任何收益之前,他们会立即获得相当可观的许可证价格标签和随后的年度支持。同时,经济理由是用白线缝制的。
真的有必要这样做吗?尤其是当董事自己没有完全理解任务和目标时。不要忘记供应商需要专门准备的事件日志,并且其准备工作可能会导致头痛,并且在传统的企业环境中进行大量的集成工作。
续前期出版物。
前言
仅仅是凡人无法进行过程挖掘吗,一切都令人恐惧且昂贵吗?
不,不,再一次,不。可以使用开源工具关闭90%的生产任务和100%的研究阶段任务。生态系统R几乎可以解决所有问题。此外,即使审计师和人力资源人员也可以掌握这些工具,并在日常活动中有效地使用它们。关于开发人员和分析师,我们能说些什么。
并且当任务很明确时,使用商业工具带来的好处将是合理的,然后您可以考虑购买商业专用软件的许可证。或者相反,关于省钱和减少浪费。
« 1- 30- », R process mining -.
-, , :
- (= ) ;
- ;
- ;
- ;
- ;
- .
:
. , , . , process-mining data-science .
, :
- , ETL - ;
- 2- 3- , «-» ;
- « » ;
- .
process-mining . data science , , , open-source R Tidyverse. , open-source . 10 , . , process-mining , , process mining office (PMO).
PMO . , data science « », .. () , .
, process-mining , . data science , PMO R
tidyverse
Excel.
R process mining:
- (open-source);
- ( , );
- ( 10-100 «» );
- ( , « »);
- ( , R > 10 . , /, , , , web , ...).
csv
, :
read_csv("./data/pmo/pmo_sales.csv")
xlsx
, :
read_excel("./data/pmo/pmo_sales.xlsx", sheet = " ")
: MS SQL, PostgreS, Oracle, MySQL, Access, Redis, Clickhouse,… "Databases using R" (https://db.rstudio.com/)
() . :
mutate
— .
df <- read_csv("./data/pmo/pmo_sales.csv") %>%
#
mutate(amount = unitprice * weight)
df
group_by
— , summarise
— .
#
df %>%
group_by(item) %>%
summarise(sum(weight), sum(amount))
select
— .
df %>%
select("" = date, ", " = amount, item)
filter
— .
df %>%
filter(amount > 1000, item == "")
arrange
— .
df %>%
arrange(date, desc(amount))
df %>%
group_by(item) %>%
gt(rowname_col = "date")
gp <- ggplot(df, aes(date, amount, color = item, fill = item)) +
geom_point(size = 4, shape = 19, alpha = 0.7) +
geom_line(lwd = 1.1) +
scale_x_date(date_breaks = "1 day", date_minor_breaks = "1 day", date_labels = "%d") +
scale_y_continuous(breaks = scales::pretty_breaks(10)) +
ggthemes::scale_color_tableau() +
ggthemes::scale_fill_tableau() +
theme_bw()
gp
gp + facet_wrap(~item) + geom_area(alpha = 0.3)
df <- read_csv("./data/pmo/pmo_school.csv")
df
activity
resourse
df %>%
mutate(new_activity = glue("{activity} - {resource}")) %>%
count(new_activity, sort = TRUE)
?
df %>%
mutate(hr = hour(timestamp), date = as_date(timestamp)) %>%
group_by(date) %>%
#
filter(timestamp == max(timestamp)) %>%
ungroup() %>%
select(date, hr, everything(), -timestamp, -part)
DWG bupaR
(https://www.bupar.net)
.
patients
patients %>%
process_map()
patients %>%
process_map(performance(median, "days"))
P.S.
- , , . enterprise. .
- , «- enterprise : . R»
- process mining , Wil M. P. van der Aalst «Process Mining: Data Science in Action». , , .. , .