中文地址编码关键技术地研究.pdfVIP

  • 29
  • 0
  • 约7.45万字
  • 约 61页
  • 2016-01-07 发布于安徽
  • 举报
摘要 摘要 地址编码是联系空间地理信息与非空间地理信息的桥梁,是各种应用地理信 息系统中必不可少的环节,也是数字城市的基础性组成部分。然而,由于中文地 址自身的诸多原因,使得中文地址编码存在很多难点问题,以至于国外在地址编 码方面的许多成熟技术不能直接应用于中文地址编码。本文在总结了国内外地址 编码的相关研究进展的基础上,从地址规范化表达、地址解析、地址模型的构建、 地址匹配等几个部分对地址编码的相关技术进行了研究,探讨相应的解决方案, 设计原型系统并将其应用到相关的案例中,主要研究内容如下: (1)中文地址规范化表达:分析中文地址的组成要素,研究不同概念粒度 层次的地址要素类型及其等级关系,制定标注规范;提取地址通名,并按照地址 要素分类体系对地址通名进行归类。 (2)中文地址解析:在确定中文地址要素分类体系的基础上,从规则和机 器学习两个方面出发,设计了基于规则的地址解析算法流程和基于条件随机场的 地址解析方法,实现了基于规则的地址解析与基于条件随机场的地址解析。实验 证明两者的解析正确率分别达到93.6%与95.7%,符合大规模处理数据的要求。 (3)中文地址模型

文档评论(0)

1亿VIP精品文档

相关文档