- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
工作流日志中工作流模式图挖掘技术研究
工作流日志中工作流模式图挖掘技术研究
摘要:工作流挖掘技术能够从系统的执行日志中构建出过程,大部分过程挖掘方法都使用了一种图形化的方式来表示模型,也就是控制流图。讨论了工作流模式图挖掘,它实际上是工作流挖掘的一种扩展;对其中所涉及的问题进行了剖析,并介绍了一种模式图挖掘算法。??
关键词:工作流;工作流日志;过程挖掘;模式图挖掘??
中图分类号:TP311文献标志码:A
文章编号:1001-3695(2008)01-0105-03
工作流是一类能够完全或部分自动执行的经营过程,根据一系列过程规则、文档、信息或任务能够在不同的执行者之间传递、执行。在过去的十年里,工作流技术在工作流管理系统、企业资源管理(ERP)系统、供应链管理(SCM)系统、客户资源管理(CRM)系统等软件中得到了广泛应用。它也一直是企业界与学术界关注的热点领域[1,2]。??
工作流日志包含了实际的工作流过程执行信息,它通常保存在系统的日志文件中。为了支持工作流的设计,更好地理解现有系统的实际过程,数据挖掘与机器学习技术被应用到了工作流领域来解决这一问题。它的基本思想是从工作流日志中提取出过程的工作流模型,该技术被称为工作流挖掘或过程挖掘[3~5]。大部分过程挖掘方法使用了一种图形化的方式来表示模型,即控制流图。它用有向图来描述过程,图的顶点表示活动,边表示两个活动间的先后关系。这种关系实际上体现了活动间的同步、并发等关系,也可称之为过程中活动间的局部约束关系。虽然这些方法能直观地描述出过程中基本活动间的先后关系,但是它们不能发现活动的执行模式,即活动的一些执行结构,或者说过程中多个活动间隐含的约束关系。这在实际应用中是大量存在的。针对这个问题,本文介绍并剖析了一种基于聚类技术的工作流模式图挖掘技术。它扩展了现有的工作流过程挖掘方法,主要特点在于对工作流日志进行了聚类分析。通过数据聚类,具有一些相同执行结构与行为的工作流日志记录聚集到同一个簇中,可以用工作流模式图来描述这种结构;然后应用层次聚类思想,逐步细化工作流模式图,最终能够较为准确地挖掘出隐含在过程中的多个活动间的约束?┕叵怠*?
1问题定义??
为了便于介绍,先简要描述要解决的主要问题。相关的一些符号定义如下:??
a)P表示一个过程。??
b)L(P)是P的工作流日志。为了便于问题的讨论,假定L(P)是一个活动串的集合,它以活动串(如a??1…a??n。其中a??i均表示P中的活动)的方式记录了P的执行信息。??
c)WS(P)表示对应于P的实际工作流模式图。它是一个三元组?QCF(P),C??L(P), C??G(P)?R。其中:CF(P)是P的控制流图;C??L(P)是P的活动局部约束关系集; C??G(P)是P的多个活动间的约束关系。??
d)WS(P)表示经过模式图挖掘得出的P的工作流模式图。它是工作流模式图的一个集合{WS??i|WS??i=?QCF??i,C??L??i,?饥R,1≤i≤m},即隐含在过程中的多个活动间的约束关系用工作流模式图WS??i来表示。??
e)soundness(WS(P),L(P))表示WS(P)的错误率。在已知WS(P)的情况下,能够推导出P的可能执行信息(假设共有A条记录),但它们不一定与L(P)一致(即L(P)中并不存在这样的记录。假设这样的记录条数为B),那么soundness(WS(P),L(P))=B/A。??
f)completeness(WS(P),L(P))表示WS(P)的完整率。相似地,L(P)中的每一条记录也不一定与由WS(P)推导出P的可能执行信息一致(即L(P)的记录并未在其中出现。假设这样的记录数为C)。设L(P)中的记录总数为D,则completeness(WS(P),L(P))=(D-C)/D。??
g)|WS(P)|表示集合WS(P)中的元素个数。??
h)σ,即如果completeness(WS(P) ,L(P))≥σ,称??WS(P)关于 L(P)是σ完整的。??
i)m表示一个自然数。??
显然,WS(P)必然是正确地隐含在L(P)中的工作流模式图。进行模式图挖掘的目标就是使WS(P)与WS(P)尽可能地接近。另外,如果|WS(P)|等于L(P)中的记录条数,即??L(P)中的每一条记录均用一个模式图来描述,那么挖掘就失去了意义,应该对它作一个限制,m表示了这种限制。
因此,工作流模式图挖掘要解决的问题是在L(P),σ,m已知的情况下,找出合适的WS(P),使WS(P)关于L(P)是σ完整的,??|WS(P)|≤m,soundness(WS(P),L(P))尽可能地小。??
原创力文档


文档评论(0)