- 1、本文档共116页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向网页文本的地理信息要素提取与空间定位方法研究摄影测量与遥感专业论文
优秀毕业论文
精品参考文献资料
关于学位论文原创性和使用授权的声明本人所呈交的学位论文,是在导师指导下,独立进行科学研究所取得的
关于学位论文原创性和使用授权的声明
本人所呈交的学位论文,是在导师指导下,独立进行科学研究所取得的 成果。对在论文研究期间给予指导、帮助和做出重要贡献的个人或集体,均 在文中明确说明。本声明的法律责任由本人承担。
本人完全了解山东农业大学有关保留和使用学位论文的规定,同意学 校保留和按要求向国家有关部门或机构送交论文纸质本和电子版,允许论 文被查阅和借阅。本人授权山东农业大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论 文和汇编本学位论文,同时授权中国科学技术信息研究所将本学位论文收 录到《中国学位论文全文数据库》,并向社会公众提供信息服务。
保密论文在解密后应遵守此规定。
论文作者签名: 础弓
导师签名: .她衣’
日 期:丝绸哟
万方数据
目录中文摘要
目录
中文摘要 ..I
Abstract II
1绪论 ..1
1.1研究背景与意义 ..1
1.1.1研究背景 1
1.1.2研究意义 .1
1.2国内外研究现状 ..2
1.2.1国内外地理信息要素识别提取研究现状 2
1。2。2国内外空间定位研究现状 4
1.3研究内容及论文体系 ..6
1.3.1研究内容 6
1.3.2论文体系 7
1.4地理信息要素特点与识别难点 。7
2基于隐马尔可夫模型的网页地理信息要素识别与提取 9
2.1隐马尔可夫模型词性标注 。9
2.2网页地理信息要素的识别提取研究 11
2.2.1基于HMM与前后缀词识别窗口的地名地址提取 .11
2.2.2基于HMM与词性识别窗口的地理实体提取 .14
2.3地理信息要素提取实验与分析 17
3地理信息要素空间定位 ..21
3.1空间定位参考库 21
3.2空间定位技术研究 .23
3.2.1地名地址空间定位 .23
3.2.2地理实体空间定位 .27
3.3地理信息要素空间定位实验与分析 29
4网络地理信息要素提取与空间定位原型系统 ..33
4.1系统概述 .33
4.2系统流程 33
4.3系统架构 34
万方数据
4.
4.3.1基础数据层 .35
4.3.2系统功能层 ..35
4.3.3对外展现层 .40
4.4系统实现与展示 40
4.4.1系统开发环境介绍 .40
4.4.2系统程序设计与展示 .41
5总结与展望 43
参考文献 。45
附录 。48
致谢 ..50
攻读硕士学位期间发表论文及其他成果 ..52
万方数据
山东农业大学硕士学位论文中文摘要
山东农业大学硕士学位论文
中文摘要
随着互联网技术与计算机技术的飞速发展,网络信息中涉及的地理信息内容越来越 多,并逐渐呈现出一种指数爆炸增长趋势,成为地理信息获取与更新的重要的途径。互 联网信息中的地理信息与其他网页内容一样,以文本的形式存在,非结构性化特征使这 些信息不容易被机器自动识别提取出来,无法作为GIS重要数据源进行进一步的统计和 分析,同时海量互联网网页文本中也不乏存在一些泄露国家机密、危害国家安全的地理 信息数据,互联网中存在的海量地理信息要素数据亟需被自动提取出来并转换为具有地 理坐标的空间数据进行分析。
对网页文本的地理信息要素提取与地理信息空间定位是解决这些问题的有效方法。 网页地理信息要素提取是将网络爬虫所获取的文本进行语义分析处理,并将其中所包含 的地名地址与地理实体有效提取。地理信息要素空间定位则是对提取出的要素通过相似 度计算、标准化、地理信息要素匹配处理等方法赋予空间坐标,以便GIS分析工具并进 行分析处理。针对网页文本中地理信息的识别提取与空间定位问题,研究结果主要包括 以下几个方面:
(1)网页文本中地理信息要素提取方法。在国内外研究现状基础上,利用隐马尔可 夫模型机器学习的方法对网页文本数据进行词性标注预处理。通过地名地址前后缀特征 词识别窗口提取候选地名地址,根据制定的规则对候选地名地址进行匹配过滤,提取地 名地址;通过HMM词性标注与词性识别窗口相结合提取候选地理实体,根据地理实体 的验证规则进行过滤,提取地理实体。最后利用网页文本数据进行实验验证。
(2)提出地名地址与地理实体空间定位策略。地名地址在空间定位之前,首先根据 地名地址标准结构体进行标准化处理,并且根据地名地址的前后文信息确定其的大体区 域范围,然后通过与定位参考库中的地名地址进行匹配比对,匹配成功的确定空间地理 坐标,匹配失败无法确定位置的按空间定位模糊策略进行处理。地理实体空间定位采用 实体名称相似度计算的方法,取与地理实体库中相似度最高的地理实体空间坐标作为待 定位实体坐标,如果相似度均不在设定阈值范围,则无法对待定位地理实体进行定
您可能关注的文档
- 多agent敏捷虚拟企业稳定性研究及改进1管理科学与工程专业论文.docx
- 多agent敏捷虚拟企业稳定性研究及改进管理科学与工程专业论文.docx
- crⅵ在细胞p53封闭条件下的线粒体损伤效应卫生毒理学专业论文.docx
- 半夏泻心汤加味颗粒治疗胃食管反流病肝胃不和证的临床观察中西医结合临床内科专业论文.docx
- 镉锌胁迫对红花生长发育及gsh特性的影响遗传学专业论文.docx
- 车牌识别技术的研究与实现模式识别与智能系统专业论文.docx
- 产品细部设计及其与产品形象塑造的关系设计艺术学专业论文.docx
- e钙粘蛋白n糖链的功能及其作用机制的研究生物化学与分子生物学专业论文.docx
- 柴达木盆地贝壳堤剖面有机分子化石与沉积环境自然地理专业论文.docx
- 对外汉语中级综合课教材练习设计考察汉语国际教育专业论文.docx
文档评论(0)