地址字分割算法.docVIP

  • 38
  • 0
  • 约1.95万字
  • 约 10页
  • 2017-08-16 发布于河南
  • 举报
地址字分割算法

基于分词的地址匹配技术 孙亚夫 陈文斌 (北京灵图软件技术有限公司,北京 100094 sunyafu@,chenwenbin@) ? ? ? 摘要? 根据调查显示,城市信息中80%都与地理位置有关,而这些信息中大多数却没有空间坐标,自然就无法整合,无法进行空间分析。这对于城市信息化建设来说,是一个极大的阻碍。为了快速的推进数字化城市的建设和发展,有必要找到一种快速、高效的方法,将大量的与地理位置相关的信息,进行坐标编码,以便于GIS系统分析、查询。本文提出了一种“基于分词的地址匹配技术”,它能将大量的非空间信息高效的转化成空间信息,极大地提高了非空间信息数据的编码、录入效率。 ? ? ? 关键词? 地理编码 地址匹配 GIS系统 地址数据库 ? 1.?? 引言 随着互联网、信息技术、GIS技术的发展,人们的生活越来越多的依赖于地图。地图制作需要的数据从哪来了?传统的数据采集方法,我们称之为“扫街”,就是通过人工的方法,到实地去采集地址的坐标。这种“扫街”的方法,由于成本太高,很显然已经不适应大量非空间信息的处理。 本文提出了一种“基于分词的地址匹配技术”,它是通过构造一种分级地址库的方法,并转换成地址分词库,采用基于地址词典的中文分词技术,实现地址匹配。采用这种方法,易于维护修改地址库,并构建一个可自学习的地址库,不断丰富完善,提高匹配范围与匹配精度。 ? ? ? 2.?? 原

文档评论(0)

1亿VIP精品文档

相关文档