- 1、本文档共70页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据
万方数据
Classified Index: TP391.2 U.D.C: 681.37
Dissertation for the Master Degree in Engineering
RESEARCH ON SEMANTIC WEB-ORIENTED NATURAL LANGUAGE QUERY INTERFACE
Candidate: Kang Shupeng
Supervisor: Associate Prof.Chen Huipeng
Academic Degree Applied for: Master of Engineering
Speciality: Computer Science and Technology
Affiliation: School of Computer Science and
Technology
Date of Defence: June, 2014
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学硕士学位论文
哈尔滨工业大学硕士学位论文
摘 要
目前,互联网上的数据呈爆炸式增长态势,海量的数据对数据存储和信息 获取带来了前所未有的挑战。语义网被认为是下一代互联网的存储方式。以语 义网形式描述的数据不仅可以被人们理解,而且可以被计算机所理解。数据在 语义网中是互相链接的,彼此之间被语义标签链接起来,形成一个巨大的语义 网络。现在,越来越多的数据以语义网的形式发布出来,但是对于普通用户而 言,从语义网中获取信息的难度远超过目前的搜索引擎。语义网目前仅支持形 式化查询,而且只有对语义网本体熟悉的专业人员才能够编写正确的形式化查 询。对于普通用户而言,自然语言形式的查询是最便捷、最易接受的查询方式。 自然语言查询接口作为一个连接自然语言查询和语义网形式化查询之间的桥 梁,具有重要的研究价值和实用价值。
如何有效的将用户的自然查询问句转化为能够查询语义网的形式化查询语 言是本文的主要研究内容。本文针对这一问题研究了英文和中文两种语言上的 自然语言查询接口任务。本文主要贡献如下:
首先,在对查询的形式进行充分分析之后,发现问题的形式具有链式规则, 即查询中匹配的资源只与其前后资源存在联系,因此,本文根据这一假设,提 出了一种基于资源补全搜索的自然语言查询接口方法。该方法在形式固定、语 法简单的问题上取得了较好的实验结果。
其次,在对资源补全搜索方法的实验结果分析之后,我们发现资源补全搜 索算法不能处理语法复杂的问题,且没有考虑查询中的语义信息。因此,我们 提出了一种基于依存图的自然语言查询接口算法,旨在充分利用查询中的语义 信息来指导形式化查询的生成。该方法的性能在美国地理数据集上较资源补全 搜索方法有较大的提升。为了测试基于依存图的自然语言查询接口算法对不同 语言环境的适应能力,我们在中文数据集上又进行了实验。分析结果得出,基 于依存图的算法在英文上的效果要优于中文上的效果。
实验表明,基于依存图的方法在自然语言查询到语义网形式化查询的转换 的任务上取得了很好的效果,同时,证明了自然语言查询接口能够有效的完成
-I-
搜索语义网信息的任务。
关键词:语义网;自然语言查询接口;资源补全;路径搜索;依存图
-II-
Abstract
Currently, the data on the Internet has explosive growth, the vast amounts of data has brought unprecedented challenges to the data storage and access to information. The semantic web is considered to be the next generation Internet way of storage. The data which is described in the form of the semantic web not only can be understood by human, but alse can be understood by the computer. Data in the semantic web is linked to each other, and linked by semantic tags, forming a huge semantic network. Now, more and more data released in the form of the semantic web, but for end-users, t
您可能关注的文档
- 煤炭企业目标市场产品分销决策研究-管理科学与工程专业毕业论文.docx
- 黄芪注射液治疗肺肾气虚证慢性肾小球肾炎的临床研究-中医内科学专业毕业论文.docx
- 论中学语文教学中的语感培养-学科教学·语文专业毕业论文.docx
- 空气压缩机状态监测和故障诊断系统的研究-机械工程专业毕业论文.docx
- 面向共享的安全文件夹加密系统的研究与开发-信息与通信工程专业毕业论文.docx
- 控制性降压对脊髓血流及诱发电位的影响-麻醉学专业毕业论文.docx
- 滤泡辅助性T细胞在口蹄疫重组腺病毒疫苗免疫应答中的作用研究-病原微生物专业毕业论文.docx
- 黄粉虫抗菌肽诱导方法的比较及实时荧光定量PCR分析-植物保护专业毕业论文.docx
- 麦秸处理含铀废水的研究-应用化学专业毕业论文.docx
- 脉冲电弧液电放电处理船舶压载水综合试验研究-电气工程专业毕业论文.docx
- 面向仿生微通道的家蚕丝蛋白溶液剪切流变与滑移特性研究-工程力学专业毕业论文.docx
- 面向汽车装配的嵌入式生产监控技术研究与系统开发-机械电子工程专业毕业论文.docx
- 绿色物流战略规划问题研究-国际贸易学专业毕业论文.docx
- 煤矸石山自燃治理措施及其稳定性分析-岩土工程专业毕业论文.docx
- 面向云平台的协同卷回恢复关键技术研究-计算机技术专业毕业论文.docx
- 面向社会物联网的信息关联建模技术研究-计算机软件与理论专业毕业论文.docx
- 锰酸锂电池的研究-电子信息材料与元器件专业毕业论文.docx
- 梅花花期调控机理初步研究-森林培育专业毕业论文.docx
- 面向集群结构的计算机故障管理系统的研究与实现-计算机技术专业毕业论文.docx
- 脉象特征提取方法研究-计算机科学与技术专业毕业论文.docx
文档评论(0)