- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
BMGSJoin:一种基于MapReduce的图相似度连接算法.pdf
第28 卷 第5 期 模式识别与人工智能 Vol.28 No.5
2015年5月 PR AI May 2015
BMGSJoin:一种基于MapReduce 的
*
图相似度连接算法
陈一帆 赵 翔 何培俊 张维明 唐九阳
(国防科学技术大学 信息系统工程重点实验室 长沙410073)
摘 要 图相似度连接在数据挖掘领域应用广泛,尤其是在数据预处理阶段,可用于数据清理、近复本检测等,其
研究具有十分重要的意义.针对基于编辑距离约束的图相似度连接问题进行研究,返回两个图集合中所有编辑距
离不超过给定阈值的图对.基于分布式编程框架MapReduce,设计采用“过滤-验证”框架的MGSJoin算法,利用基
于路径的q-gram签名实现非解候选对的过滤,计数过滤.鉴于该算法键值对数量庞大的潜在问题,引入Bloom Filter
技术对算法进行改进并设计BMGSJoin算法.实验结果表明,提出的两种图相似度连接算法能较大地改善现有算法
的效率和可扩展性,并能较好地应对当前大数据挖掘分析的需求.
关键词 图相似度连接,MapReduce,布隆过滤器
中图法分类号 TP391.4 DOI 10.16451/ ki.issn1003-6059.201505011
BMGSJoin:A MapReduce Based Graph Similarity Join Algorithm
CHEN Yi-Fan,ZHAO Xiang,HE Pei-Jun,ZHANG Wei-Ming,TANGJiu-Yang
(Science and Technology on Information System and Engineering Laboratory,National University of
Defense Technology,Changsha410073)
ABSTRACT
Graph similarityjoinhasextensiveuseinthefieldof datamining,especially indatapre-processing,
it could be applied to data cleaning,near duplicate detection,etc. Thu
您可能关注的文档
- 2012年高考文综历史试题特点及启示(重庆卷).pdf
- 2012年高考文综历史试题特点及启示《福建卷》.pdf
- 2012年高考湖南卷文科第16题的完整解答.pdf
- 2012年高考语文北京卷命题综述.pdf
- 2012高考文综地理试卷(重庆卷)评析.pdf
- 2012高考语文现代文阅读篇目大观.pdf
- 2013年中国经济改革突破点.pdf
- 2013年全国高考四川卷(文)20题的极坐标和参数方程解法.pdf
- 2013年广东高考现代文阅读题评析及备考建议.pdf
- 2013年度食品药品监管统计年报发布.pdf
- BOLD MRI对早期移植肾急性排异反应鉴别价值的初步研究.pdf
- Box-Behnken设计优化浊点萃取-原子荧光光谱法测定中药材中的汞.pdf
- BP-DEMATEL在空港竞争力影响因素识别中的应用.pdf
- BP神经网络及在岩性识别上的应用研究.pdf
- BP神经网络在大跨斜拉桥的斜拉索损伤识别中的应用.pdf
- BP神经网络大腿截肢者运动模式识别.pdf
- BST红外探测器阵列像元信号检测电路设计.pdf
- Burkholderia thailandensis E264pBMTL3-tdpR发酵生产抗癌药物Thailandepsin A的研究.pdf
- B_4C粒度配比对B_4C-Al复合材料显微组织与力学性能的影响.pdf
- B型钠尿肽和CA125联合检测在呼吸困难鉴别诊断中的临床价值.pdf
最近下载
- 消除艾滋病、梅毒和乙肝母婴传播工作实施方案(2025版) .pdf VIP
- 工作流培训课件.ppt
- 24J306:窗井、设备吊装口、排水沟、集水坑.docx VIP
- 人教版八年级物理上册第五章《透镜及其应用》第一节`透镜同步练习 含答案.docx VIP
- 人教版九年级上册初中美术全册教案(教学设计).doc VIP
- PW2051_2.0数据手册下载.pdf VIP
- 接地电阻测试记录表(填写).docx VIP
- 2023整理全国汉字听写大赛题库及答案.pdf VIP
- 部编版小学道德与法治六年级下册8《科技发展造福人类》教学课件.ppt VIP
- 2026年江苏农林职业技术学院单招职业适应性测试必刷测试卷必考题.docx VIP
文档评论(0)