基于K―means和布谷鸟算法流程模型聚类.docVIP

下载本文档

5
0
约9.51千字
约 17页
2018-08-28 发布于福建
举报
版权申诉

基于K―means和布谷鸟算法流程模型聚类.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于K―means和布谷鸟算法流程模型聚类

基于K―means和布谷鸟算法流程模型聚类　　摘要：流程模型聚类是流程管理领域的一个热门话题。本文提出一种基于布谷鸟算法的K-means算法，该算法弥补了K-means算法的依赖初始解、易陷入局部最优等缺点。本文从流程模型结构性能、成本、效率、顾客满意度以及质量等五个方面模拟数据集，并选择权重较高的属性进行试验操作，结果表明算法的具有较高的可行性和有效性。　　Abstract： Process model clustering is a hot topic in the field of process management. This paper presents a new K-means algorithm based on cuckoo algorithm， which compensates drawbacks of traditional K-means algorithm， such as relying on initial solution and being easily trapped in local optimums. In this paper， simulated data sets consist of five features （process model structure performance， cost， efficiency， customer satisfaction and quality）， but experiments are conducted by only two indicators with higher weight. Experimental results show that the method has relatively higher feasibility and effectiveness. 　　关键词：布谷鸟算法;K-means算法;流程模型聚类　　Key words： cuckoo algorithm;K-means;process model clustering 　　0 引言　　随着流程管理领域关键技术的快速发展以及大型组织或跨国企业拥有越来越多的纷繁复杂的业务流程，建立流程模型库成为一种趋势，而如何对流程模型库进行全面管理和维以及挖掘使用流程模型库成为目前热点问题之一。对于已聚类的业务流程模型进行流程挖掘，挖掘出更多的模型中隐含的信息，有助于企业领导做出正确的决策，同时用户也可以根据自己的需要进行个性化定制，大大提高了流程模型的使用效率和用户的满意度。流程模型以求解业务流程相似性的流程模型聚类成为解决流程模型库维护问题的新趋势。对于业务流程模型聚类的问题，传统的求解方法是利用业务流程模型的结构化组成部分，求解模型相似度，从而进行流程模型聚类。文献[1]将从标签文本、结构和行为相似三个方面，求解流程相似性。Dijkman等在文献[2]中提出利用图匹配的流程模型相似性机制。基于图编辑距离（graph edit distance）比较的结构相似性机制同时考虑了文本相似度和模型拓扑结构[3]。关于流程行为相似性，相关文献提出了各种流程行为等价的概念，如互模拟等价（bisimulation）[4]、轨迹等价（trace equivalence）[5]等。但是这些等价概念只能划分出等价和非等价，而不能给出一个量化的值。为此，专家、学者从不同的角度提出测算方法，Aalst等在文献[6-7]提出基于流程日志的观察行为（observed behavior）方法，Wang等提出基于首要变迁序列（principal transition sequence）的有标志Petri网的行为相似性度量方法[8]。Jin等提出一种基于流程结构和语义特征进行模型聚类后再检索的机制[9]，其目的是为了提高模型检索效率，避免在查询过程中遍历模型库中的每一个流程模型。这些相似性研究的也为流程模型聚类提供了大量的理论研究。关于流程模型聚类，文献[10]提出了以业务单据为中心的流程模型聚类，以层次聚类算法进行聚类，进行模型预处理。　　K-means算法是由Steihaus、Lloyd、Ballamp;Hall、J.B.Mac Queen分别于1955年、1957年、1965年、1967年在不同的科学研究领域提出的经典的基于划分的聚类算法，该算法效率较高、容易实施，且易于和其它方法相结合，是成为数据挖掘、机器学习、模式识别和数量统计等领域应用最广的聚类算法之一的主要原因[11]。　　布谷鸟（Cuckoo Search，简称 CS）算法是由剑桥大学的YANG Xin-she和拉曼工程大学的DEB Suash在文献[12]中提出的一种新的仿生算法，该