基于模糊匹配算法的门址定位方法.pdfVIP

  • 14
  • 0
  • 约7.92千字
  • 约 3页
  • 2018-05-09 发布于福建
  • 举报
第3O卷第6期 成 宁 学 院 学 报 Vo1.30,No.6 2010,年 6月 JournalofXianningUniversity Jun.2010 文章编号:1006—5342(2010)o6—0053一O3 基于模糊匹配算法的门址定位方法 杨敬锋 ,李 亭2,卢启福 ,陈志民3 (1.广东融讯信息科技有限公司,广东 广州 510656;2.中山火炬职业技术学院,广东 中山 528436; 3.华南农业大学公共基础课实验教学中心,广东 广州 510640; 4.广东瑞图万方科技股份有限公司,广东 顺德 528305) 摘 要:为实现地址数据的高效匹配,本文提 出了一种基于模糊匹配算法的门址定位方法,并实现 了地址数据的 完全匹配、模糊匹配以及模糊定位.以快递业务数据为实验数据,实验结果表明,该方法能取得较好的匹配效果, 并且定位方法简单实用可行,为快递业务降低退回率提供了一种有效的方法. 关键词:模糊定位;模糊匹配;地址匹配;快递业务 中图分类号:TP18 文献标识码:A 0 引 言 了完整的查询引擎和索引引擎、部分文本分析引擎 ,以方便 现有电子地图的门址信息大多采用 “扫街式”进行采 的在 目标系统中实现全文检索的功能,或者是以此为基础 集,该方法能相对准确地对所采集的门址进行定位,但同时 建立起完整的全文检索引擎.Lueene的检索过程实际是把 也存在采集周期长、实施难度大以及数据加工成本高等弊 模糊查询转化为多个可以利用索引进行精确查询的逻辑组 端.以电子地图门址库使用较多的领域快递业务为例,快递 合的过程 ,它不需要很多的I/O操作 ,大大提高了多关键字 业务体系中的电子地图和快递业务员直接影响到快速送达 检索的效率.此外,Lucene通过复杂的映射过程,进行相似 服务的速度,一方面接收人地址描述的不规范引起 电子地 度运算,使得检索结果的精确度更高…. 图无法进行定位时需要快递业务员根据自己对地址的熟悉 2 模糊匹配与模糊定位方法 程度进行地址定位,另一方面,在电子地图和快递业务员都 地址数据在电子地图上的定位方式有几种,包括精确 无法进行定位时,通过电话的描述往往难以将具体位置表 定位、模糊定位以及不能定位等三种方式,电子地图的坐标 达清楚,造成了目前快递平均退回率往往在 20%以上.从 与地址数据时间匹配方式对地分为精确匹配、模糊匹配以 信息化的角度出发,造成高退回率 的根本原因在于快递接 及不能匹配三种匹配方式. 收人地址与电子地图POI的匹配率较低,为此 ,学者们提出 2.1精确匹配与精确定位方法 了一些改进方法,如地址匹配引擎”J、基于WebGIS的中文 精确匹配是快递业务中最理想的方式 ,接收人地址信 属性模糊匹配服务引擎 J、地址匹配与模糊匹配技术 “ 息与地理编码库中的相应信息完全匹配,电子地 图可直接 等,这些改进方法都能根据相应的地理编码规则提高快递 将坐标信息赋予完全匹配的实体地址信息. 接收人与电子地图数据库中的地址数据的地址匹配率,一 2.2 模糊匹配与模糊定位方法 定程度上降低退回率,但这些方法的实现都必须以拥有能 由于历史原因,国内的地址存在地址命名的规律性差、 实现实时更新的电子地图数据才能保持较高的匹配率,对 格式复杂、门牌的命名很随意、增删改现象严重、层次性差、 于快递公司正在使用的定期更新的电子地图数据库 ,其匹 缩写与简称的普遍使用、中文连词书写与地址的非词组表 配效率难以提高,而对于一些电子地图数据库中完全不能 达矛盾等问题 ,而且快递业务中的地址信息往往采用手写 进行匹配的地址数据,如接收人地址以 “对面”、“附近”等 方

文档评论(0)

1亿VIP精品文档

相关文档