- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
地理信息检索中空间相似性度量的一种模糊方法.pdf
第31卷第4期 地理与地理信息科学 V01.31No.4
andGeo-InformationScience 2015
2015年7月 Geography July
1672—0504.2015.04.008
doi:10.3969/i.issn
地理信息检索中空间相似性度量的一种模糊方法
刘家骏,李浩然,钟翔,高勇”
(北京大学遥感与地理信息系统研究所,北京100871)
摘要:一般使用地理信息检索技术提取互联网中以文本方式存在的地理信息,检索返回结果的排序需充分考虑其
空间范围的相似性。但传统的空间相似性计算方式忽视了以文本形式存在的地理信息所隐藏的模糊性,从而导致
片面性和局限性。该文对文本中以空间陈述形式存在的地理信息进行深入分析,将模糊性因素主要归纳为参照对
象和空间关系。通过引入不确定场模型来描述每个因素对模糊性的贡献程度,整合得到空间陈述的模糊footprint
表达,建立文档与查询的模糊footprint表达模型。在此基础上,提出了空间相似性模糊度量的计算方法,根据空间
相似度对返回的检索结果进行排序。实验结果显示,该方法能够更好地反映空间检索的模糊性,更好地衡量空间
检索和网页文档在空间位置上的相似程度,从而在检索结果的排序上优于传统方法。
关键词:空间相似度;模糊性;footprint;地理信息检索
中图分类号:P208 文献标识码:A 文章编号:1672—0504(2015)04—0038一05
包括方位关系、度量关系及拓扑关系[7],都具有一定
0引言
程度的模糊性。方位关系包括定量和定性两种表达
互联网中包含了海量以文本形式存在的地理信 方式,但在日常生活中,一般很少使用准确的角度,
息,为充分利用资源,迫切需要能够处理文本地理信 通常采用定性的主方向(东、东北等)来描述。度量
息的工具或方法。一般情况下,利用地理信息检索 关系同样可分为定性描述和定量描述。在定性描述
Information
(Geographic Retrieval,GIR)检索网页中,多采用“附近”等词汇,而诸如“距离很远”则很少
文档中的地理信息时,需要同时从主题和空间位置 使用,因为其描述更为模糊不清;定性描述不仅仅依
两方面评估文档和用户查询间的相关性[1]。其中,赖于参照对象的空间大小,也依赖于陈述的环境。
空间位置部分将用户检索和文档中以地名、地址等 而对于定量度量关系,即使在陈述中采用了准确的
文本表述的地理信息,在地名辞典或地名库的帮助 数字,对应的现实世界范围也可能是不确定的。相
下,转换为以坐标表达的几何图形,作为其地理范围 对而言,拓扑关系较准确。实际使用时,相离关系一
(geographicfootprint)22,3i,再计算两者的空间相似般被度量关系和方向关系取代[8]。
性。将文本地理信息转化为footprint时,考虑到简如果忽略空间陈述的模糊性,footprint的表达
洁性和准确性,通常采用最小外包矩形[4](MBR)表将具有很大的局限性和片面性,导致空间相似度计
示,并利用重叠面积或Hausdorff距离[51计算两个算出现较大误差,使得GIR返回的排序结果不理想。
多边形地理范围间的空间相似度。 针对文本地理信息的模糊性问题,本文引入了不确
GIR中,地理信息以文本的形式描述(网页文本定场模型,用以表示上述模糊性,并通过建立查询和
或者是查询语句),将蕴含地理信息的文本称为一条 文档的模糊footprint,计算每个文档与查询的空间
空间陈述6],它包含3个要素,即参照对象,空间相似度,从而解决查询结果的排序问题。
关系,主题。但也正因为自然语言的天然属性,用
1模糊footprint建模
来描述空间范围本身具有模糊性。空间陈述在空间
范围上的模糊性主要来源于参照对象和空间关系的
您可能关注的文档
- 地方志在历史城市地理研究中的应用探析.pdf
- 地方性立法与道德法律关系论——从"不让座罚款"和"精神赡养"规定谈起.pdf
- 地方本科院校动物科学专业(对口招生)人才培养模式研究.pdf
- 地方立法权下放之科学立法问题审视.pdf
- 地方课程资源开发与初中地理教学改革的路径思考 ——以宁德初中地理教学实践为例.pdf
- 地方道德文化资源在思想政治理论课教学中的应用初探——以《思想道德修养与法律基础》课程为例.pdf
- 地方院校创建“物理与科学”探究馆的思路与措施.pdf
- 地方高校动物科学专业KAQ培养与产学研对接育人模式的探析.pdf
- 地球化学环境对宣化地区葡萄品质的影响分析.pdf
- 地球物理勘探技术与煤炭科学开采之研究.pdf
文档评论(0)