- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于规则中文地址分词与匹配方法-chinese address segmentation and match method based on rule
摘要在信息时代的今天,城市各部门都存有大量与地址有关的地理位置信息,这些数据大多是非空间信息,无法通过地理信息系统来实现行业之间的数据共享。因此,城市地址信息空间化是数字城市建设的重要组成部分。地理编码技术正是实现城市地址信息空间化的方法,它提供了一种将文本描述的地址信息转换为地理坐标的方式,通过编码技术和地址匹配来确定此地址数据在电子地图上对应的地理实体位置。通过地理编码技术,大量的社会经济数据将变成坐标化的空间信息,从而进行更快速有效的空间分析,为政府决策提供支持。论文以武汉市的地址研究为项目背景,进行中文地址分词与地址匹配研究。利用地理编码技术实现地址的快速查询匹配和社会经济数据的空间化,建立数据库统一管理,从而实现城市各部门、行业数据的共享。主要研究内容和取得的成果如下:(1)改进了现有的地址模型,并根据此地址模型将地址数据规范化,建设完备的标准地址数据库。(2)在研究了几种地址分词及匹配方法的基础上,提出一种基于规则的地址分词匹配方法,加入了规则树和歧义存储等机制,通过算法改进,提高了地址残缺和歧义这两类模糊地址的匹配成功率。(3)建立了知识学习机制,通过地址补录模块,将匹配失败和数据库中缺少的地址补录入库,从而不断完善标准地址数据库。关键词:地理编码,地址标准化,中文地址分词,地址数据库,规则库,地址匹配ABSTRACTIntheinformationageoftoday,therearealargenumberofaddressinformationinthecitydepartments.Mostofthedatasarenon-spatialinformation,wecannotsharethembyGeographicinformationsystem.Soit’samainpartofdigitalcitybuildingtoinformationizethecityaddressinformation.Geocodingisamethodtoinformationizethecityaddressinformation,whichprovidesawayoftranslatingthetextaddresstogeographiccoordinates.Bygeocodingtechnology,alargenumberofsocio-economicdatawillbecomespatialinformationintheformofcoordinates,datasharingcanbeachievedbetweenthecitydepartmentsandtheindustry,sotherewillbeamorerapidandeffectivespatialanalysisanddecision-making.ThepapertakestheresearchoftheWuHanaddressesastheprojectbackground,usingtheaddressGeocodingtechnologytoachieveaddressrapidqueryandsocio-economicdataspatialization,andbuildaddressdatabase.Thenwecanshareinformationinthecitydepartments.Themaincontentsoftheresearchare:Improvingtheexistingaddressmodel,thenwemadeaddressstandardizationbythenewmodel,andbuildthestandardaddressdatabase.Researchsomeaddresssegmentationandgeocodingmethods,andproposearule-basedChineseaddressgeoeodingmethod.Weaddruletreeandambiguitystoragemechanismtoimprovethesuccessrateoffuzzyaddressmatching.Thepapercreatesalearningsystem,sowecanadddatabasewithfail-matchingaddressbyaddressaddingmodule.Keywords:Geocoding,Addressstandardization,Chineseaddresssegmentation,Addressdatabase,Ruledatabase,Addressmatching目录1绪论..........................
您可能关注的文档
- 基于改进归一化割甲状腺肿瘤b超图像分割-ultrasound image segmentation of thyroid tumors based on improved normalized thyroidectomy.docx
- 基于改进区分矩阵的属性约简算法分析与应用-analysis and application of attribute reduction algorithm based on improved discernibility matrix.docx
- 基于改进型卡尔曼滤波旋转弹姿态测试-attitude test of rotary projectile based on improved kalman filter.docx
- 基于感性工学视角的计时产品认知界面研究——从时间的呈现方式到载体关联-research on the cognitive interface of timed products based on kansei engineering perspective - from presentation mode of time to carrier association.docx
- 基于感阻理论的暖通空调水管网动态特性分析-analysis of dynamic characteristics of hvac water pipe network based on resistance sensing theory.docx
- 基于感知数据路况信息管理服务系统软件体系结构设计-software architecture design of road condition information management service system base on perceptual data.docx
- 基于港口供应链的运输方式与运输路径集成优化模型分析-analysis of transportation mode and transportation route integration optimization model based on port supply chain.docx
- 基于告警关联的网络安全风险评估方法的分析与实现-analysis and implementation of network security risk assessment method based on alarm association.docx
- 基于格林模式对患儿家长抗菌药物自我药疗行为的分析-analysis of self-medication behavior of children's parents with antibiotics based on green's model.docx
- 基于隔离分级的受损数据隔离技术分析-analysis of damaged data isolation technology based on isolation classification.docx
文档评论(0)