基于Hadoop业务过程模型管理方法研究.docVIP

基于Hadoop业务过程模型管理方法研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Hadoop业务过程模型管理方法研究

基于Hadoop业务过程模型管理方法研究   摘要:目前现有业务过程模型研究的共同特点便是基于单机环境来构建业务过程库,并基于传统关系数据库来管理业务过程模型,完成相关的检索、存储等操作。为提高大规模业务过程模型检索与存储的效率,本文提出一种新的业务过程模型管理方法。该方法采用基于Hadoop大数据处理平台对业务过程模型进行管理,并采用Map/Reduce编程框架和HDFS文件系统分别对业务过程模型进行检索和存储,提高了业务过程模型存储效率,减少了模型检索匹配的时间。通过原型系统进行试验验证评估,证明了所提方法在存储和检索效率方面高于单机环境。   关键词:业务过程模型管理;Hadoop;检索;存储;效率   中图分类号:TP311文献标识码:A   1引言   随着计算机与网络的不断发展与成熟,以信息技术为主导的各种高新技术为企业的发展提供了极大的支持,其中敏捷制造、并行工程、企业业务过程重组、供应链管理等先进制造技术的应用与推广成为当前企业赢得市场竞争采取的主要手段。以上技术都以企业业务过程为基础施行的,从而要求企业管理的模式从传统面向功能部门制的管理转化为面向企业业务过程的管理,简称面向过程的管理。业务过程是指在人员和技术的协调下所进行的一组为实现共同业务目标而采取的活动。在20世纪90年代以前企业采用的基于功能部门制的管理方式是一种严格的递阶式关系管理,易造成组织之间交流上的障碍。而面向过程的管理方式,通过业务过程将企业中的活动连接起来,模糊了组织边界,通过组织间的无障碍交流提高企业工作效率。   业务过程模型是一种通过定义组成活动及活动间逻辑关系,来描述工作过程的模型,是企业业务过程分析与重组的基础,是记录和保存企业经营过程知识的一种有效途径。由于业务过程模型描述了业务是如何一步步被处理的,也描述了在业务处理过程中数据是如何被处理的,人员是如何配置的,因此业务过程模型成为了组织部门很重要的资产。随着业务过程管理系统越来越广泛的应用,导致各行各业积累了越来越多的业务过程模型,有些企业已经积累了上千的业务过程模型。这样便产生了一系列新的问题,例如:如何存储业务过程模型?如何进行业务过程模型的检索?   国内外已有相关学者对此展开研究,但现有研究的共同特点便是基于单机环境来构建业务过程库,并基于传统关系数据库来管理业务过程模型,完成相关的存储、检索等操作。但事实上,从信息处理的角度看,业务过程模型可视为一种特殊类型的数据,由于业务过程模型是由众多企业组织机构生成的,它具有数据源多样性、分布性等特点,当业务过程模型的规模增长到一定规模时,传统关系数据库在处理这些这样海量的数据时出现性能和可扩展性的瓶颈。更为重要的是,利用单台主机来管理业务过程模型,尽管主机能达到很高的硬件配置,但其处理能力还是有限的。因此,采用分布式存储和计算来管理大规模业务过程模型将是一种必然的发展趋势。   目前,分布式存储和计算领域,全球约有上百种不同的方案,而Hadoop是其中使用较为广泛的一种。近年来,随着大数据研究与应用兴起,工业界已经广泛使用 Hadoop 作为其大数据处理平台,且具有相对较为成熟的商业应用。Hadoop技术宗旨就是在于分布式处理数据,采用分布式计算和存储技术,并且将简化了分布式处理细节。Hadoop非常适合处理非结构化的海量数据。因此,基于Hadoop来完成海量分布的业务过程模型管理可能是一种可行的解决方案,该研究不仅具有重要的理论意义,同时也具有十分重要的实际应用价值。   计算技术与自动化2015年12月   第34卷第4期卢厅等:基于Hadoop的业务过程模型管理方法研究   2相关研究   业务过程模型可以采用图表示,因此可以基于图检索领域相关工作和业务过程模型检索领域两个方面分析业务过程领域相关工作。在基于图检索领域可以借鉴的工作的有基于图结构的精确检索与基于图结构的相似性检索。在文献[1]中,作者Ke Y总结了图检索方面的工作。Shasha D 等人[2]基于图路径建索引,用户设定被索引的最长路径的长度;文献[3]改进了FG-Index,对于经常使用的查询建立了索引。   在基于业务过程模型检索领域也出现了很多相关工作。文献[4-6]提出基于业务流程建模标注BPMN的模型检索语言,采用了数据库管理系统的检索性能来加速BPMN模型检索的机制;文献[7,9]是业务过程模型相似检索工作的综述,文中涉及的所有工作由于无索引来提高检索效率,因此采用逐个模型与检索样例模型比较相似度的方法,十分耗时。在文献[9]中,作者提出了基于度量树索引方法,该方法使用图编辑距离计算模型相似度。在文献[10]中,作者基于最大公共子图和最小公共超图的图匹配方法,提出了JTangWFR流程推荐系统,该方法使用图编辑距离

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档