- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
YARM基于MapReduce的高效可扩展的语义推理引擎.pdf
第 38卷 第 1期 计 算 机 学 报 Vo1.38 No.1
2015年 1月 CHINESEJoURNALOFCOMPUTERS Jan.2015
YARM:基于MapReduce的高效可扩展的
语义推理引擎
顾 荣 王芳芳 袁春风 黄宜华
(南京大学计算机软件新技术国家重点实验室 南京 210046)
摘 要 随着语义网的快速发展 ,RDF语义数据大量涌现.大规模 RDF语义数据推理的一个主要 问题是计算量
大、完成计算需要消耗很长的时间.显然 ,传统的单机语义推理引擎难以处理大规模的语义数据.另一方面,现有的
基于MapReduce的大规模语义推理引擎 ,缺乏对算法在分布和并行计算环境下执行效率的优化,使得推理时间仍
然较长.此外 。现有 的推理引擎大多存在可扩展性方面 的不足,难 以适应大规模语义数据 的增长需求.针对现有 的
语义推理系统在执行效率和可扩展性方面的不足,文 中提出了一种基于 MapReduce的并行化语义推理算法和引
擎 YARM.为 了实现分布和并行计算环境下的高效推理,YARM做 出了以下 4点优化 :(1)采用合理的数据划分模
型和并行化算法,降低计算节点间的通信开销;(2)优化推理规则的执行次序,提升了推理计算速度;(3)设计了简
洁的去重策略,避免新增作业处理重复数据 ;(4)设计实现了一种新 的基于 MapReduce的并行化推理算法.实验结
果表明,在真实数据集和大规模合成数据集上,YARM 的执行速度 比当前最新的基于MapReduce的推理引擎快
1O倍左右 ,同时YARM还表现 出更好 的数据和系统可扩展性.
关键词 RDF)RDFS推理;MapReduce~语义推理;分布式推理
中图法分类号 TP338;TP182 DOI号 10.3724/SP.J.1016.2O1多.00074
YARM :EfficientandScalableSemanticReasoningEngineBasedonM apRde uce
GU Rong WANG Fang—Fang YUAN Chun-Feng HUANG Yi_Hua
(StateKeyLaboratoryforNovelSoftwareTechnologyatN口 ingUniversity,Nanjing 210046)
Abstract TherapiddevelopmentoftheSemanticW ebhasproducedmassiveamount0{theRDF
data.ThemajorchallengeforlargescaleRDFsemanticreasoningisthatitinvolveshugeamount
ofcomputation.Thismakesthewholeprocessvery time—consuming. Itisobviousthatthe
traditionalsemanticreasoningenginesarenotefficientwhendealingwiththemassiveamountof
RDF data.On theotherhand,thestate-of-artdistributed semanticreasoningalgorithmsbuilt
withM apReduee lack ofoptimization forreasoning processin a distributed and parallelized
environment.Thus,thisstillmakesthereasoningprocessrelativelytime—consuming.In addition,
mostofexistingreasoningengineslackofscalability.To solvetheseproblems,wedesignand
implementYARM ,anew para
原创力文档


文档评论(0)