大数据环境下基于贝叶斯推理中文地名地址匹配方法.PDF

大数据环境下基于贝叶斯推理中文地名地址匹配方法.PDF

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Vo1. 44 No. 9 第 44 卷第9 期 计算机科学 2017 年 9 月 COMPUTER SCIENCE Sep.2017 大数据环境下基于贝叶斯推理的中文地名地址匹配方法 t午普乐王杨黄亚坤黄少芬赵传信陈付龙 (安徽师范大学数学计算机科学学院 芜湖 241000) 摘 要 传统的中文地名地址匹配技术难以处理大数据环境下海量、多祥和异构的智慧城市地理信息空间中的中文 地名地址快速匹配问题。提出了一种 Spark 计算平台下基于中文地名地址要素的匹配框架及应用智能决策的匹配算 法CA且 Intelligent Decision Matching Algorithm, AIDMA) 。首先,ρ、中文地名地址中富含的语义性和中文字符串、数 字与字母之间的自然分隔性两个方面进行地址要素解析,构建了融合多距离信息的贝叶斯推理网络,从而提出了基于 多准则评判的中文地名地址匹配决策方法。然后,利用芜湖市 514967 条脱敏后的燃气开户中文地名地址信息库与 1770979 条网格化社区中的中文地名地址信息库(包含网格化地址的地理空间信息)进行实验与分析。实验结果表 明,在处理大规模中文地名地址信息时,相比于传统的中文地名地址匹配方法,该方法能够有效提高羊条中文地名地 址的匹配效率,同时在匹配度与精确度两个指标上匹配结果更加均衡。 关键词 大数据,Spark,中文地名地址匹配技术,贝叶斯推理 中图法分类号 TP391 文献标识码 A 001 10. 11896/j. issn. 1002-137叉 2017.09.050 Chinese Place-name Address Matching Method Based on Large Data Analysis and Bayesian Decision XU Pu-le WANG Yang HUANG Ya-kun HUANG Shao-fen ZHAO Chuan-xin CHEN Fu-long (School of Mathematics Computer Science ,Anhui Normal University ,Wuhu 241000 ,China) Abstract Traditional matching technologies of Chinese place-name address is hard to deal with the fast matching prσ blem of Chinese place-name address in matching massive ,diverse and heterogeneous geographic information under the big data environment. An intelligent decision matching algorithmCAIDMA) based on computing framework of Spark was proposed. Firstly ,geographical elements are analyzed from semantic information and separations of Chinese strings , numbers and letters. Bayesian networks is constructed with three kind of distance combined with multi-criteria decision making effectively. 514957 desensitized gas account information and 1770979 g

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档