嵌入式平台上地址搜索.docVIP

  • 1
  • 0
  • 约4.88千字
  • 约 4页
  • 2017-07-02 发布于福建
  • 举报
嵌入式平台上地址搜索

嵌入式平台上的地址搜索 李 勇 陈文斌 (北京灵图软件技术有限公司,北京 100094 liyong@,,henwenbin@) ? 摘? 要:地址匹配技术是地理信息系统中的一项重要技术。本文在借鉴各种地址模型的基础上,提出了一种可以应用于嵌入式中的简化层次地址模型,建立了一个嵌入式中的搜索模式的地址匹配服务框架,并最终实现了嵌入式平台上的地址匹配搜索服务程序。结果显示这种方法具有很高的效率,很好的满足了用户的地址匹配查询需求。 ? 关键词:地址模型,地址要素,地址搜索,倒排索引 前言 在现实世界中,人们通过地址来描述城市中的目标地理位置。这种现实世界的定位方式是通过一段文字来表示目标位置的。如,我们用“北京市海淀区东北旺西路8号”来表示中关村软件园的位置。在地理信息系统中,计算机无法通过诸如以上的文字信息来直接定位目标位置。目标位置是由其所在地的地理空间坐标确定的,常用的如该地的经纬度等。这就需要将能被人们记住的文字地址信息和地理信息系统中的地理空间坐标建立起一一对应的联系,从而实现人们与地理信息系统的交互。 地址匹配技术(GEOCODING,也称地址编码)正是在这种背景中发展起来的。地址匹配是将地理坐标(例如经纬度)赋予街道地址还有其他点位和地理特征的过程[1]。有了地理坐标,地理特征就可以被显示到地图上或运用到地理信息系统中。 美国是地址匹配技术应用最早,最广泛的国家。从二十世纪六十年代开始,美国就开始了地址信息的收集以及标准的建立工作,在1976年研究发展了“双重独立地图编码系统”(Dual Independent Map Encoding,DIME),于1990年前后发布了与人口数据相关的全国人口地址编码系统:Topologically Integrated Geographic Encoding and Referencing System,即“图形整合地理编码参照系统”,简称TIGER。另外,国外的很多商用地理信息系统软件中都有相关的地址匹配模块,如ArcInfo的GeoCoding和MapInfo的MapMaker等,都实现了基本的地址编码框架和匹配引擎[2]。 而对于我国,由于国情不一样,地址地名等信息缺少统一的标准,又缺乏有效的服务体系,使得国外的地理编码软件在我国并不适用。从八十年代开始,一部分城市的规划、测绘及管理部门对城市地址编码问题相继开展了研究工作。由于地理信息应用的社会化,基于位置的服务需求强烈,地理编码和地址定位技术也得到越来越多的重视。国内也有一些公司开发了相应的地理编码软件和应用,如北京长地计算机公司的“导址神”,北京灵图软件公司的地址匹配引擎等。 上述的各种系统都是基于服务器或者个人计算机的地址匹配服务程序。而近些年,随着嵌入式系统软硬件的发展,各种带有导航等地理服务系统的智能终端获得了广泛的应用。在这些系统中,需要相应的地址匹配服务功能。由于嵌入式系统的各种限制(主要是CPU的处理速度、内存的大小、IO的速度、外存的大小等),使得嵌入式系统中的地址匹配技术和基于服务器和个人计算机的地址匹配技术有着很大的差别。基于服务器和个人计算机的地址匹配技术并不能直接简单地移植到嵌入式系统中来使用。 本文在借鉴基于服务器和个人计算机的地址匹配技术的基础上,通过分析中文地址的特征,提出一种嵌入式上的地址匹配服务框架,并在嵌入式系统中实现地址匹配的功能。这种地址匹配技术应用了当代搜索引擎的一些技术,更像是一种地址搜索功能,具有高效的特征,非常适合嵌入式系统中的应用。 1 地址数据的分析和地址模型 地址是对具体地点的规范文字描述,主要是指由地名地址主管部门正式认可或命名的对确定地点的完整文字描述,通常以地址标牌的形式确立。地址通常是由一个或多个地址要素组成,每一个地址要素为地址串中的一个相对独立的部分。地址要素包含行政区划、道路名、自然地理名、门牌号、楼牌号等。这些要素按大的地址要素在前,小的地址要素在后的方式组合形成的地址名称。关于中文地址国内进行了许多卓有成效的研究[1、2、3,4,5],下面简单介绍一下比较通用的两种模型。 文献[2]主要介绍了一种层次地址模型,其认为各个地址要素存在着一对一或者是一对多的包含关系,比如一个省包含若干个市,一个小区对应着某条道路的某个门牌号等等,并且总结出了大约40种地址层次模式。这种地址模型的特点在于具有良好的可扩充性,对于新的地址模式可以方便的添加,并且可以针对不同城市采用不同的模式,缺点在于,有时候地址并不存在严格的包含关系,这时候用这种模型来描述就存在误差。 针对上述模型的缺点,文献[1]提出了一种网状模型,其认为地址要素之间是一种带有固定包含指向的网状结构,并且用有限状态自动机来描述和解析各种地址。这种地址模型的缺点在于扩充性不好,修改地址模式比较复杂。

文档评论(0)

1亿VIP精品文档

相关文档