基于语义相似度的地理信息检索技术分析-analysis of geographic information retrieval technology based on semantic similarity.docxVIP

基于语义相似度的地理信息检索技术分析-analysis of geographic information retrieval technology based on semantic similarity.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语义相似度的地理信息检索技术分析-analysis of geographic information retrieval technology based on semantic similarity

1绪论1.1研究背景及意义“人类正在被数据淹没,但人类却贫乏于知识。”随着互联网技术的飞速发展,网络上的信息量急剧增长。面对庞大的信息资源,人们感到无所适从,迷失在Internet这张巨大的信息网中,“信息过载”和“信息迷航”己经成为人们谈论最多的话题之一。因此,信息技术领域的一个热点问题就是如何帮助用户高质量地检索获取真正有用的信息。但是目前实用的信息检索系统,主要是基于人工分类目录和关键词匹配的。前者由于需要手工操作,对海量信息资源的揭示的效率和深度都很有限,后者仅局限在字符形式匹配的层面上,对信息的语义、语用的揭示极为有限,同时多义词、同义词等异构信息的存在使得这种词形匹配方式的缺陷日益明显,因此许多检索系统经常会出现检索不全、答非所问的情况。而对于约占人类信息80%左右的空间信息来说,由于具有多样性、分布性、异构性的特点,给空间信息的查询、共享和互操作等带来了诸多不便。同时,限于相关技术的发展瓶颈,目前空间信息资源的提供者对数据的描述大多停留在数据的表层上,数据间缺乏必要的关联,导致计算机无法理解数据的内涵,更难以准确地发现和识别满足用户需求的数据,从而影响用户获取信息的速度和效率。空间信息查询是指按一定要求对地理信息系统所描述的空间实体及其空间信息进行访问,从众多的空间实体中挑选满足用户要求的空间实体及其相应属性的操作。GIS通过电子地图与用户交互,一般都提供放大、漫游等功能,操作起来很方便;但是对于空间查询,则要求用户掌握一定的专业知识,很多情况下还必须会使用SQL一类结构化查询语句,这对GIS的大众化和社会化提出了挑战。相对应的是越来越多的普通用户希望能方便的获取空间信息服务。而在传统的地理信息检索方式中,以下问题日益明显:(1)地理空间信息表现形式的多样性。传统的地理空间信息常以地名或空间坐标的形式表示。但这两类常见的地理空间信息因为国度、文化、承载介质的不同而表现各异。随着人类对地理信息世界认识的不断深入以及地理空间信息解决方案的不断改进,地理空间信息的表现形式逐渐走向多样化,这为地理空间信息的检索带来了许多挑战。如当人们表达“山东”这一地理空间信息时,即可以使用“ShanDong”、“齐鲁”、“山东”等名称外,还可以使用矢量地图、栅格地图、影像地图等图形形式来表达。此外,还可使用行政区划代码、手机号码、电话区号、邮政编码、身份证号码等非传统形式来表示。(2)地理空间信息描述的模糊性。这主要表现在两个方面。一方面是在描述地理空间信息时使用了无法精确定位的名称。另一方面是对地理空间信息的描述存在歧义。如部分不同地区的地名称谓相同、或者地名与方位名相同,这些名称在传统的词形匹配方式信息检索时极易造成混淆,给地理空间信息的检索造成障碍。(3)空间关系的提取与搜索相对复杂。例如想要查询黄河流经的县市,如果通过传统的GIS查询,首先要将河流图层和城市图层叠加,然后进行相交计算,缓冲区分析等地理操作,需要用户拥有相关的处理软件并具备一定的相关知识,而且相对较为繁琐。(4)传统信息检索主要以关键词词形匹配的方式实现,同义词、多义词等异构信息的存在使得这种词形匹配方式的缺陷日益明显。地理信息的检索在传统信息检索基础上发展而来,因此的继承了这个缺陷。针对地理信息服务特别是地理信息检索中存在的诸多问题,国内外学者将本体(Ontology)应用到地理信息检索中,以期将传统的词形匹配方式转变为语义匹配方式,其目标是捕获领域内相关知识,提供对该领域知识的共同理解,确定该领域内共同认可的概念,并从不同层次的形式化模式上给出这些概念(术语)以及概念之间相互关系的明确定义(冯志勇等,2007)。从本质上说,本体反映了给定领域的通用观点,表达了该领域中的概念和这些概念之间关系集合的语义。因此,基于本体的信息检索技术能形成较好的语义理解,能有效地提高信息检索的效率。语义相似度一直是计算机领域和认知语义学领域研究的热点。随着人们对地理信息需求的增加,语义相似度也逐渐成为GIS领域研究的热点。GIS领域研究语义相似性主要是为了更好地提供地理信息检索服务和实现地理信息系统集成、互操作:用户在查询需要的地理信息时,往往并不了解数据在数据库中的名称和存储结构,另外人们对世界认知的不同方式,导致对同一地理现象的观察描述会侧重于对象不同的侧面,从而产生观点上的差异,并形成语义异构。这就要求系统能够对用户表达的查询语句进行相似匹配,把满足条件的信息返回给用户。本文采用本体的思想,研究本体在地理信息检索方面的应用。试图将本体在信息检索中的部分研究成果运用到GIS领域,充分利用本体的语义关系维护能力以及空间数据库与地理本体之间的形式化对应关系构建地理本体,在此基础上,结合本体推理功能实现地理本体的查询扩展。此外,对基于本体语义相似度的地理信息检索方法进行研究,解决

您可能关注的文档

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档