- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于地址分词的自动地理编码算法.pdf
20 11年 第 2 期 马照亭 ,等 :一种基于地址分词的自动地理编码算法 59
文章编号 : 0494 09 11 (20 11) 02 005904 中图分类号 : P208 文献标识码 : B
一种基于地址分词的自动地理编码算法
1 2 1 1
马照亭 ,李志刚 ,孙 伟 ,印 洁
( ( ) )
1. 中国测绘科学研究院 ,北京 100830; 2. 嘉兴市规划 测绘 管理局 ,浙江 嘉兴 3 14000
An A utom a tic Geocod ing A lgor ithm Ba sed on A ddress Segm en ta tion
MA Zhaoting, L I Zh igang, SUN W ei , Y IN J ie
摘要 :针对我国多数城市地名 /地址表述的不规范性 ,基于可伸缩地址模型提出地理编码数据库的构建方案 ,设计一种基于地址
分词的自动地理编码算法 。首先根据地理编码库编制地址词典 ,利用地址词典对地名 /地址进行地址分词 ,形成地址要素及其级
别 ;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配 ;最后分析影响这种地理编码算法精准度的因素 ,并
提出相应的改进措施 。实践证明,该算法匹配准确率高 ,可以服务于我国数字城市、省区和国家级地理信息化建设 。
关键词 :地址模型 ;地理编码数据库 ;地址词典 ;地址分词 ;地址匹配 ;地理编码量化
务体系 ,导致国外的地理编码技术和软件在我国并
一 、引 言 [ 3 ]
不适用 。
随着地理信息采集手段的不断普及和 GIS软件 近年来 ,我国在地理编码方面也作出了大量的
的不断成熟 ,越来越多的政府部门、公司、企事业单 努力 ,不少单位在地址模型 、地理编码标准 以及地
位基于地理信息构建本单位的业务应用 。一些传 址匹配技术方面取得了一些成果 。如李军针对北
统上似乎与地理信息系统关联性较弱的部 门或单 京市地址现状 ,提出了复杂层次的地址模型 [ 4 ] ; 在
位 ,如工商 、税务 、药监 、传媒等 ,也纷纷提出了借助 地理编码标准方面 , 国家测绘局组织编制了国家标
地理信息管理本部门信息的要求 。但是这些部 门 准 《数字城市地理信息公共平台地名 /地址分类 、描
或单位的专题信息采集时并不直接具备空间坐标 , ( )
述及编码规则 》 GB / T 23705—2009 ,提出了城市
只是具有文字描述的地名 /地址信息 。只有将这些 内部地名 /地址分类 、规范描述及编码的规则 [ 5 ] ;在
地名 /地址转换成空间坐标 ,专题部 门才能将专题 地址匹配技术和软件方面 ,文献提及较多的是早期
数据与地理信息叠加 ,才能利用 G IS软件的可视化 北京长地计算机公司的 “寻址神 ”和北大方正数码
和空间分析功能辅助本部门应用 。这种将地名 /地 公司的 “M ap Search ”软件 ,近期并无成熟软件问世 。
址信息映射成空间坐标的过程就是地理编码 [ 1 ] 。 由于没有适合国内应用的地址模型 ,未能建立标准
文档评论(0)