问答系统研究综述.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
问答系统研究综述 关键词: \t /page/2019/0402/_blank 信息检索 \t /page/2019/0402/_blank 问题分析 摘 要 目前,问答系统已经广泛应用到社会各个方面,其作为整个计算机领域重点的研究领域,引起了人们的高度重视。文章对问答系统的基础概念、发展历史、关键技术及未来的发展趋势进行简要阐述,旨在为问答系统今后发展打下良好基础。 关键词 问答系统;信息检索;答案抽取;问题分析 中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2019)230-0147-02 随着互联网的迅猛发展和计算机的广泛普及,人们一直寻找迅速并准确地获取信息的方法。在过去20年里,各类搜索引擎产品不断出现和发展,迎合了用户的信息检索需求。然而当数据量不断增加,海量数据资源汇集到一起时,搜索引擎的缺点逐渐开始暴露。传统的搜索引擎只能以检索关键词作为输入,这就要求用户必须用数量有限的词来准确表达查询需求,对用户的信息检索能力要求较高,这对于绝大多数普通用户来说并不友好。 此外,传统搜索引擎返回的结果通常也不尽如人意,仍需用户自己在搜索引擎系统返回的网页列表中查找具体的信息,这就容易使用户的体验大打折扣。基于上述存在的问题,问答系统应运而生,与传统搜索引擎不同,问答系统可以针对任意以自然语言形式提出的问题返回给用户确切的答案。由此可见,问答系统能更好地表达和满足用户的要求。本文对问答系统的发展历史、关键技术及发展趋势进行简要介绍,旨在帮助读者对问答系统有全面的认识和了解。 1 问答系统发展历史 问答系统的发展历史已有70余年,早在1950年,计算机科学之父艾伦图灵便提出了使用自然语言进行人机交互的相关技术,进而使得问答系统的诞生成为了现实。 在20世纪60年代,借助人工智能的相关技术,第一批问答系统出现在人们的视眼中,典型的代表系统有BASEBALL、LUNAR和ELIZA[ 1 ]。Baseball允许用户对篮球比赛的相关内容进行提问,并返回相应的结果;Lunar能够对岩石样本分析实验的相关内容进行问答;ELIZA系统主要用于精神疾病患者的恢复过程,能够实现简单的交流过程。这3个系统都在各自的领域中取得了巨大的成功,但这些问答系统只能接受特定形式的自然语言问句形式,无法实现开放领域的问答。 在20世纪70年代和80年代期间,随着计算机语言学理论的深入研究及发展,问答系统也逐渐向着更为复杂的领域发展。这个时期诞生了大量的项目,其中就包含了著名的Berkeley Unix Consultant(UC),然而UC系统提供的对话实例并不能完美应用到现实对话场合中。 20世纪90年代以后,问答系统进入了开放领域和基于自由文本的新时期,在此期间,国外开发出一些相对成熟的问答系统。1993年,麻省理工学院(MIT)的人工智能实验室开发出了世界上第一个名为START的问答系统。START可以回答一些有关地理、文化、科技、历史等方面的简单问题。例如:对于问题“Whats the capital of China?”START将会回答“The capital of China is Beijing.”。密歇根大学于2002年开发的AnswerBus[ 2 ]是个多语种的自动问答系统,它可以回答以英语、法语、和葡萄牙语等语言提出的问题。 在文本信息检索会议(TREC, Text Retrieval Conference)将QA track引入到会议主题后,新型问答系统的研究发展得到了进一步促进,问答系统研究自此进入了开放域研究的时代[ 3 ]。现如今,越来越多的高校和公司都参与到了有关问答系统技术的研究中,包括人们熟知的苹果、三星、Google、阿里巴巴、剑桥大学等,使得问答系统的发展得到了进一步推进。同时,凭借着信息技术的发展,问答系统的研究者们总结提炼了大量的常问问题与回答数据,为问答系统技术的进一步发展打下了坚实的基础。其中典型的代表为2005年出现的社区问答(community based question answering,CQA[ 4 ])数据,如Yahoo! Answer。 2 问答系统关键技术 问答系统关键技术主要包括问题分析、信息检索、答案抽取3个部分。本章节将对这3个部分进行简要介绍。 2.1 问题分析 在问答系统工作时,首要的任务便是对用户提出的问题进行分析。问题分析包括类型分析、主旨识别、问句指代及语法分析等工作。问答系统的首要工作是判定问题的类别,通常问题的类别也是答案的类别,所以这个过程对问答系统来说必不可缺。问答系统规则分类器根据问题的特征对用户提出的问题进行分类,之后对问题中的关键词进行提取;关键词的提取是问题分析的核心步骤,问答系统往往会对关键词进行扩展来更好的理解用户的查询意图;最后

文档评论(0)

管理体系认证咨询师 + 关注
实名认证
服务提供商

专注与管理制度建设、ISO9000、ISO14000、IS045001、SA8000、HACCP、CMMI、ISO20000、ISO22000、ISO27001、HSE、ISO/TS16949、ISO13485管理体系认证咨询

1亿VIP精品文档

相关文档