基于频繁增长模式的工作流过程挖掘方法.docVIP

基于频繁增长模式的工作流过程挖掘方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于频繁增长模式的工作流过程挖掘方法   摘要:工作流管理系统要求能够清楚地表达出业务过程的工作流设计,通常工作流设计非常费时且容易出现错误。过程挖掘的方法从已经发生的业务日志记录中提炼出工作流模型,能方便地设计工作流管理系统。本文提出利用FP-tree(频繁增长模式)方法挖掘过程模型,使之能够有效地解决含有噪音数据的过程挖掘问题。   关键词:工作流;过程挖掘;事件日志;频繁增长模式   中图分类号:TP311文献标识码:A 文章编号:1009-3044(2008)11-20324-05   1 引言      近十年来,工作流管理概念和技术在企业信息管理系统中已经获得了广泛的应用。典型的工作流管理系统如:Staffware、IBM MQSeries、COSA等都提供了通用的模型,它们都具备了处理结构化事务过程的能力。除了纯粹的工作流管理系统以外,许多其它的软件系统也采用了工作流技术,例如ERP(企业资源计划)系统:SAP、PeopleSoft、Baan、Oracle和CRM(客户关系管理)等。   许多专家曾指出,现存的工作流程管理系统存在太多限制,缺乏动态处理事务的能力,这些问题大多是由于工作流设计(预先构造确定的工作流模型)和工作流执行(工作流的实际执行)之间的差异引起的。以往的工作流模型一般是由顾问、经理和专家组成的设计小组设计出的,因此,工作流设计往往是不完备的、主观的而且处在一个太高的层次上,也即是说,在配置工作流管理系统和训练员工等细节问题上引起了很多的问题。由于这个原因,Weijters和Aalst等一些学者提出了“相反的过程”的观点[3]。以前工作流设计程序是设计人员根据业务分析结果,设计工作流模型。Weijters等首先收集事件发生时有关工作流过程的一些信息记录,然后对这些信息进行过滤、挖掘,最终生成工作流模型。本文在Weijters和Aalst研究的基础上,假设不存在工作流模型,通过工作流程日志挖掘来构造具体的过程模型,提出了一种基于FP-tree(频繁增长模式)的工作日志挖掘方法。   本文的结构如下:在第1节介绍过程挖掘的相关概念;第2节给出新的挖掘方法;第3节对实验结果测试和分析;最后总结并指出进一步要做的工作。      2 相关概念      过程挖掘的思想不是新近提出的,Cook和Wolf在软件工程背景下就提出了过程挖掘问题,在[12]描述三个过程挖掘方法:一是1993由Dos和Mozer提出的基于神经的网络方法;二是1972年由Biermann和Feldman提出的纯粹地算法方法;三是1996年由Cook和Wolf提出的马尔科夫方法。普遍认为后两种方法是比较有发展前景的方法,故我们采取了纯粹地算法方法。   工作流管理联盟[18]认为,工作流是一类能够完全或者部分自动执行的经营过程,根据一系列过程规则、文档、信息或任务能够在不同的执行者之间传递与执行。通过定义不同任务之间相互关系的工作流模型(也称为过程模型)实现业务过程的自动化。工作流模型是对工作流的抽象表示,也是对业务过程的抽象表示。由于工作流需要在计算机环境下运行,所以建立相应的工作流模型就是必不可少的,而且工作流模型不仅仅要让人读懂,更要让计算机能够理解所定义的工作流过程。   Petri-网作为一种从过程的角度出发描述和分析复杂系统的模拟工具,具有形式化的语义定义、直观的图形表达和严格的数学基础等优点,很适合描述具有并发、异步、分布乃至不确定性因素在内的复杂系统,因此,基于Petri-网的工作流建模越来越广泛应用于业务过程建模和流程优化。Ellis和Nutt在Petri-网的基础上提出了ICN(Information Control Nets)模型,用库所表示活动,用变迁表示活动间的转移。W.M.P van der Aalst则在Petri-网的基础上定义了WF-net(WorkFlownet),即工作流网。在工作流网中,变迁表示活动,库所则表示活动的使能条件。WF-net的主要思想是过程的观点,对功能、组织、信息、操作的观点进行了抽象,在使用高级WF-net时可以对WF-net进行颜色和层次扩展。虽然WF-net非常简单,但是它的描述能力却非常强。   本文将模型限制在合理的WF-net。如果一个工作流网是合理的,那么它必须满足如下条件:(1)任何案例或过程最终必须结束;(2)过程结束的时刻在库所o中有一个标记,并且所有其他库所都是空的;(3)不存在死任务,即可以遵循适当的路由来执行一个任意的任务。合理性是一个工作流网至少要满足的性质,它意味着工作流网中不存在任何的活锁和死锁。      一个工作流日志是一个事件序列,每个事件用案例标示符和任务标示符来描述。一个事件 E=(c,t)是由多个案例c

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档