- 1、本文档共99页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
摘要
近年来,互联网的迅速发展,使得人们能够在这个平台上方便地保存数据、
交流信息以及共享知识。但是,互联网中海量的数据给用户快速准确地获得这些
所需的知识带来了困难。针对这样的需求,基于W_eb的信息检索和信息抽取逐
渐成为了重要的研究课题。当搜索引擎的不足开始凸现,如何将丰富的资源合理
地利用,使机器理解其中信息,成为网络时代机器智能的一大热门研究课题。在
这样的背景下,建立在信息检索与信息抽取技术之上的问答技术领域蓬勃发展起
来。问答系统以自然语言的问题取代关键字作为输入,允许用户准确表达自己的
需求:将准确的答案短句返回给用户,节约了用户搜索、定位答案的时间。
问答系统按照获取答案的方式可以分为自动问答系统和交互式问答系统两
种;根据系统所处理的问题的范围可以分为开放领域问答系统和特定领域问答系
统两种。前者不限输入的问题范围,试图为任意主题内的任意问题寻找答案。后
者只接受针对某一个特定领域的问题,往往有此领域内的领域知识作为指导。本
文针对信息抽取在问答系统中的应用,围绕这两种不同的问答系统展开了研究。
对开放领域内的问答,研究了如何加强对问题的语义分析能力、如何更有效地利
用历史数据库以提高机器智能;对特定领域内的问答,研究了如何更好利用经验
解决新的问题等,以提高问答系统的答案正确率。本文的主要研究内容和创新之
处如下:
第一,对问题语义的准确分析是把握用户需求的关键。本文对文本中语义约
束信息的识别展开了研究,期望对有信号词指示的语义约束部分,给出正确的检
测,并对由同一信号词指示的多种语义约束,给出正确的区分。为此提出了一种
运用依存关系树比对来检测文本中多语义约束的方法。对每一类语义约束,搜集
信号词以及相应的例句组成案例库,并定义部分依存关系树(PDT)核函数来计算
两个对象之间的相似度。在实际计算过程中,运用Apriori算法,来降低计算该
核函数的复杂度。
第二,不管是自动问答系统还是交互式问答系统,都在日积月累的用户使用
中积累了大量的问答数据。为了有效地重用这些历史数据,本文开展了从历史问
答对中抽取知识的研究,期望将短文本答案的问答对蕴含的知识自动转化为结构
化的知识表达,不断积累;并使得系统可以凭借积累的知识库进行查询检索,并
返回结果。这样一是可以节约建造知识库的人力,二是可以对新问题给出一个参
考答案,节约交互式系统中用户得到答案的时间。为此本文描述了从问答对到知
识库转化的工作流程,将语义模板匹配和上述语义约束的识别的工作相结合,来
摘要
获取对问题句中知识的提取,并运用以语义网络为基础的结构来表达互相联系互
相约束的知识簇。实现了一个用户交互式的原型系统,演示了上述知识库积累和
使用的过程。
第三,在特定领域内的自动问答中,领域知识起到非常关键的作用。在一些
领域中,经验是解答新问题的最好的依据。因此,本文以植物生长环境的推荐任
务为应用场景,对用基于案例推理的方法来重用该领域内的经验进行了研究。提
出了一种学习获取修正规则的方法。运用资源空间模型(RSM)和语义链接网络
(SLN)来表达和构建案例库,将案例之间相互联系起来。以案例比对的方法分
析案例库,以得到修正规则;案例之间的联系和基本领域知识,给相似度计算提
供了指导;运用距离测量值和置信度值来提高修正规则的生成和运用的精度;设
计了一个进化模块,依据解决新问题的经验来更新修正规则集,提供了系统的学
习能力。
关键词:互联网问答系统信息抽取依存关系树知识库基于案例的推理
Abstract
ABSTRACT
ofthe could store
Withthe Wbb,peopleeasilydata,exchange
rapiddeVelopment
informationandshare onthis ofdata
knOwledge
ontheW.eb tousersto
文档评论(0)