【过程发现算法2】Inductive Miner-InFrequency(基于频次的归纳式挖掘算法)

本文主要是介绍【过程发现算法2】Inductive Miner-InFrequency(基于频次的归纳式挖掘算法),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Inductive Miner-Infrequency(基于频次的归纳式挖掘)是在上一节Inductive Miner的基础上进行改进的算法,由sander改进并完善,接下来,我们将详细地介绍这个算法。

1. 背景介绍

关于infrequent的解释:在大多数现实生活中的事件日志中,一些轨迹很少被采用,或者轨迹的不同之处仅在于不经常发生的活动。

如果模型中包含不常见的行为,可能会牺牲简单性(simplicity),如果模型中排除不常见的行为,可能会牺牲适合性(fitness)。幸运的是,帕累托原则(the Pareto principle,也称为8020规则)通常适用于事件日志。通常,80%的观察到的行为可以用一个模型来解释,这个模型只占描述所有行为所需模型的20%80%模型展示了过程中的“高速公路”。

为了获得80%的模型,传统的方法是在发现模型之前对日志进行全局过滤

在本文中,我们提出了这种方法的扩展,称为Inductive Miner - infrequent (IMi),旨在快速发现一个合理的80%模型。我们IM的所有步骤中引入了不常见行为过滤器(infrequent behaviour filters),这样就可以在本地过滤不常见的行为

2.算法介绍

具体做法:通过在IM的所有步骤中添加不常见的行为过滤器来引入IMi

轨迹和事件的频率被IM忽略,但被IMi考虑在内,以区分频繁和不频繁的行为.

参数:K表示用户定义的介于01之间的阈值,用于区分频繁和不频繁的行为

1.操作符上的过滤器和切割选择步骤;

2.基本案例上的过滤器

3.日志分割上的过滤器

2.1  操作符上的过滤器和切割选择步骤

(1)启发式方法过滤

  L1=[<a, b, c, a, b, e, >50, <a, b, f, e >100, <d, e, f >100, <d, f, e >100, <d, e, d, f >1]

 说明

IMi过滤只包含最频繁边的直接跟随图。如图a所示,与e的其他输出边相比,边(ed)相对不频繁,所以边<e,d>被过滤掉。如果一个节点的输出边的频率小于该节点最强输出边的频率的k倍,则该节点的输出边太不频繁在切割×、→和循环之前,在IMi中过滤掉所有不常见的边缘被过滤掉

(2) 最终跟随关系图

  L2=[<a, c, d, e, b>, <a, b, a, e , d, c>, <a, e, c, b, d>, <a, d, b, c, e >]

说明:如下图b所示, 由于b的所有输出边缘都具有频率1,因此k的任何值都不能过滤边(ba)

若采用图c的最终跟随图,则能有效地过滤掉边<b,a>。

类似于弱序关系,IMi使用最终跟随图,这是直接跟随关系的传递闭包:当且仅当a后面跟b在日志中的某处时,才存在边(ab)

2.2 基本案例上的过滤器

(1) 单个活动

说明:如图所示, 分割的子过程L1和L2重演一个过程模型,则存在如下问题:

L1中,所有的轨迹都很频繁,(flower model)花型模型显然是最好的选择。然而,在L2中,只有<a>是频繁的,a最能代表频繁的行为。

选择任一选项都会影响质量维度:若选择<a>,L1会牺牲fitness,若选择一个花型模型,L2会牺牲精度precision。只有当日志每个轨迹中a的平均出现次数足够接近1(取决于相对阈值k)时,IMi才会发现a

(2) 空轨迹

说明:事件日志L通过分割运算符得到三个子日志L1,L2,L3,子日志L2中存在一条空轨迹,其频次远远小于其他的轨迹的频次,如果不采用过滤,将会影响模型精度。 

2.3 日志分割上的过滤器

 说明:在日志上进行的分割,四个符号依次表示:选择、顺序、并发、循环,在日志层面四种切分运算符满足的格式如图中所示。

3.工具插件

(1)使用prom6运行的插件svn下载地址:prom - Revision 46111: /Packages/InductiveMinerDeprecated/Trunk (tue.nl)

运行插件界面图:

(2)使用pm4py调用Inductive Miner算法的链接地址:

PM4Py - Process Mining for Python (fraunhofer.de)

 4.总结

IMi通过引入了不常见行为过滤器,将轨迹和事件的频次考虑在内,区分频繁和不频繁的行为,在三个层面上应用了行为过滤器,相比于基础的Inductive Miner,更能精准地发现过程模型。

参考文献:Leemans S J J, Fahland D, Van Der Aalst W M P. Discovering block-structured process models from event logs containing infrequent behaviour[C]//International conference on business process management. Springer, Cham, 2013: 66-78.

下一讲将介绍最基础的过程挖掘算法Heuristic Miner(启发式挖掘算法)。

如需进行相关的了解或者交流,欢迎私信或者加入QQ群:

这篇关于【过程发现算法2】Inductive Miner-InFrequency(基于频次的归纳式挖掘算法)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/651402

相关文章

Spring boot整合dubbo+zookeeper的详细过程

《Springboot整合dubbo+zookeeper的详细过程》本文讲解SpringBoot整合Dubbo与Zookeeper实现API、Provider、Consumer模式,包含依赖配置、... 目录Spring boot整合dubbo+zookeeper1.创建父工程2.父工程引入依赖3.创建ap

Linux下进程的CPU配置与线程绑定过程

《Linux下进程的CPU配置与线程绑定过程》本文介绍Linux系统中基于进程和线程的CPU配置方法,通过taskset命令和pthread库调整亲和力,将进程/线程绑定到特定CPU核心以优化资源分配... 目录1 基于进程的CPU配置1.1 对CPU亲和力的配置1.2 绑定进程到指定CPU核上运行2 基于

Java进程异常故障定位及排查过程

《Java进程异常故障定位及排查过程》:本文主要介绍Java进程异常故障定位及排查过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、故障发现与初步判断1. 监控系统告警2. 日志初步分析二、核心排查工具与步骤1. 进程状态检查2. CPU 飙升问题3. 内存

Java中的雪花算法Snowflake解析与实践技巧

《Java中的雪花算法Snowflake解析与实践技巧》本文解析了雪花算法的原理、Java实现及生产实践,涵盖ID结构、位运算技巧、时钟回拨处理、WorkerId分配等关键点,并探讨了百度UidGen... 目录一、雪花算法核心原理1.1 算法起源1.2 ID结构详解1.3 核心特性二、Java实现解析2.

SpringBoot整合liteflow的详细过程

《SpringBoot整合liteflow的详细过程》:本文主要介绍SpringBoot整合liteflow的详细过程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋...  liteflow 是什么? 能做什么?总之一句话:能帮你规范写代码逻辑 ,编排并解耦业务逻辑,代码

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

MySQL中的InnoDB单表访问过程

《MySQL中的InnoDB单表访问过程》:本文主要介绍MySQL中的InnoDB单表访问过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、环境3、访问类型【1】const【2】ref【3】ref_or_null【4】range【5】index【6】

浏览器插件cursor实现自动注册、续杯的详细过程

《浏览器插件cursor实现自动注册、续杯的详细过程》Cursor简易注册助手脚本通过自动化邮箱填写和验证码获取流程,大大简化了Cursor的注册过程,它不仅提高了注册效率,还通过友好的用户界面和详细... 目录前言功能概述使用方法安装脚本使用流程邮箱输入页面验证码页面实战演示技术实现核心功能实现1. 随机

Navicat数据表的数据添加,删除及使用sql完成数据的添加过程

《Navicat数据表的数据添加,删除及使用sql完成数据的添加过程》:本文主要介绍Navicat数据表的数据添加,删除及使用sql完成数据的添加过程,具有很好的参考价值,希望对大家有所帮助,如有... 目录Navicat数据表数据添加,删除及使用sql完成数据添加选中操作的表则出现如下界面,查看左下角从左

CSS3打造的现代交互式登录界面详细实现过程

《CSS3打造的现代交互式登录界面详细实现过程》本文介绍CSS3和jQuery在登录界面设计中的应用,涵盖动画、选择器、自定义字体及盒模型技术,提升界面美观与交互性,同时优化性能和可访问性,感兴趣的朋... 目录1. css3用户登录界面设计概述1.1 用户界面设计的重要性1.2 CSS3的新特性与优势1.