基于结构化工作流网隐含任务挖掘方法.docVIP

基于结构化工作流网隐含任务挖掘方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于结构化工作流网的隐含任务挖掘方法 [摘 要] 过程挖掘是一种客观、自动化的过程分析技术,它通过挖掘过程日志来得到业务过程的结构模型,是传统过程分析手段的重要补充。如何正确挖掘包含隐含任务的不完整过程日志,是过程挖掘需要解决的难题之一。现有的一些算法如基因算法、α#算法等解决了部分类型隐含任务的挖掘问题,但仍有许多类型的隐含任务无法被正确挖掘。针对这一问题,本文在α#算法的基础上提出了一种基于结构化工作流网的挖掘算法,该算法能够较为完整地挖掘各类包含隐含任务的结构化工作流网模型。通过理论分析和实验验证,该算法的正确性和有效性得到了证明。 [关键词] 过程挖掘;结构化工作流网;隐含任务;改进α算法 doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 07. 025 [中图分类号] tp391 [文献标识码] a [文章编号] 1673 - 0194(2012)07- 0048- 04 0 引 言 面对激烈的市场竞争和市场环境的快速变化,现代企业必须能够随时对核心业务过程做出适当的调整以适应新的需要。这不但需要管理者能够掌握外部环境的变化,也需要管理者能够对企业业务过程的实际情况有清晰的了解。传统的过程分析手段,如调查、访谈、建模分析和模拟等,费时费力,而且受用户的主观性影响很大,容易出现偏差,因此越来越难以满足用户的需要。 过程挖掘是一种自动化的过程分析技术,通过对业务过程日志的挖掘,自动生成业务过程的执行流模型,从而帮助用户更好地理解业务过程的内在执行逻辑[1]。由于其分析的依据——业务过程日志是企业在实际业务运行过程中生成的客观记录,因此该技术客观性强、费用低、速度快,有效地弥补了传统过程分析手段的各种缺陷,并已经在政府公共工程、医院和供应链管理等实际领域中取得了一定的成功应用[2-4]。 对包含错误、隐含任务[5]等的不完整日志的挖掘是过程挖掘面临的难题之一。因为实际中用于挖掘的日志主要来源于企业的信息系统的自动生成,因此日志中包含错误的情况并不常见,不完整日志问题基本上都是由于包含隐含任务造成的。现有的大多数过程挖掘算法在处理包含隐含任务的日志时都无法得到正确的结果。少数几种能够处理隐含任务的算法,如基因算法[6]、α#算法[7]等,但只能挖掘部分类型的隐含任务,未能完全解决隐含任务的挖掘问题。 针对这一问题,本文尝试提出一种基于α算法[8]和结构化工作流网[9]的过程挖掘算法,该算法能够比较全面地挖掘结构化工作流网模型中的各类隐含任务。通过理论分析和实验验证,该算法的正确性得到了证明。 1 问题说明 过程挖掘通过对日志信息的分析来构造过程模型。为了保证挖掘算法能够最大限度地适用于各种形式的日志,绝大多数挖掘算法仅要求日志中包含下列3项内容:①事件所属的工作实例;②执行事件的业务单元(任务标识);③事件发生的顺序(处理时间)。因此,在分析过程挖掘算法时,为了简便起见,通常直接将日志写成诸如abcde,abcdf,acbde,acbdf的形式,其中每个字母代表一个任务,每个逗号隔开的字母序列代表一条日志实例。对该日志实例用算法进行过程挖掘,就可以得到如图1(a)所示的结构化工作流网过程模型。 在现实中,由于很多信息系统只对进行实际业务操作的业务单元活动进行记录,以及系统采用的过程建模工具本身的特性等各种原因,一些过程任务往往没有被记录在日志中。这种过程任务就是所谓的“隐含任务”。现有的大多数算法无法正确处理包含隐含任务的日志。例如,假设图1(a)中过程的任务d是一个隐含任务,则得到的日志是abce,abcf,acbe,acbf。用α算法挖掘将得到如图1(b)所示的模型,它不是一个合法的结构化工作流网模型,而且相比原始模型,其结构复杂,不容易为用户所理解。 现有少数算法能够挖掘部分类型的隐含任务,但都无法完全挖掘所有类型的隐含任务。例如,图2给出了α #算法能够挖掘的几种隐含任务,其中黑色方块表示隐含任务。但它无法挖掘图1(a)类型的隐含任务。 因此,本文在综合现有各种隐含任务挖掘方法的基础上,结合结构化工作流网本身的特性,提出了一种基于算法和结构化工作流网的过程挖掘算法,该算法能够比较全面地挖掘结构化工作流网模型中的各类隐含任务。 2 结构化工作流网中的隐含任务 2.1 结构化工作流网 过程挖掘通过深入分析过程日志来构造出过程模型。显然,算法所使用的建模语言决定了算法能够成功挖掘的过程及其日志的特性。目前,绝大多数过程挖掘算法都采用工作流网[10]或者其子集作为建模语言,它是petri网的一个子集,具体定义如下: 定义1(工作流网) 工作流网n为五元组(p,t,f,i,o)。其中,p为全体库所集合,t为全体变

文档评论(0)

hy840215 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档