- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于问答式检索技术代理式数字参考咨询系统研究
基于问答式检索技术代理式数字参考咨询系统研究
[摘要]首先分析代理式数字参考咨询系统研究背景,认为引入检索技术是实现代理式参考咨询的有效、具有创新性的技术解决方案之一。基于此,对问答式检索技术原理进行介绍,进而分析代理式数字参考咨询系统的特征和主要流程。最后设计基于问答式检索技术的代理式数字参考咨询系统原型。
[关键词]代理式数字参考咨询 问答式检索 原型设计
[分类号]G250.7
1 研究背景
网上代理型参考咨询服务系统是不需要咨询员参与、操纵或干预且基于咨询经验的参考咨询系统。系统具有启发式引导功能,用户通过与系统的交互可以得到启发和帮助。目前,代理型参考咨询服务系统多处于模型设计阶段,实践项目较少。原因之一是该系统多以自动问答技术(QA)为基础,而自动问答技术又是以自然语言理解为基础,涉及实体抽取、实体关联、概念语义分析、情感分析等多个复杂技术。目前相关技术缺乏成熟的、准确性高的应用型算法,且技术的应用和整合都有着较高难度。
检索技术是目前各类非结构性的信息分析技术中最为成熟的应用之一。相对自动问答技术而言,检索技术是一种更实际的解决方案。问答式检索技术是集自然语言处理和信息检索于一身的新一代搜索引擎技术;除了对用户意图的理解外,该技术还强调在已有资源中使用检索技术智能地组织返回结果,而不只是提供一句简洁答案(如一般QA系统)或多篇文档结果(如Google等一般检索系统)。鉴于此,本文引入问答式检索技术设计一套代理式数字参考咨询系统,以最终实现图书馆用户的自助式服务、专业化服务甚至跨语言服务。
2 问答式检索技术原理
问答系统是指系统接受用户以自然语言形式描述的提问,并从大量异构数据中找出能回答该提问的用户真正有用的、准确简洁答案的信息检索技术。典型的问答系统通常由提问处理模块、检索模块和答案抽取模块三部分组成。其中,提问处理模块负责对用户的提问进行处理,生成查询关键词(或称提问关键词、扩展关键词等),确定提问答案类型以及提问的句法、语义表示等。检索模块根据提问处理模块生成的查询关键词,使用传统检索方式,检索出与提问相关的信息,返回的信息可以是段落也可以是句群或者句子。答案抽取模块从检索模块检索出的相关段落、句群或句子中抽取出与提问答案类型一致的实体,根据某种原则对候选答案进行打分,把概率最大的候选答案返回给用户。
在不同的应用环境中,需要设计不同类型的问答系统。基于大规模真实文本固定语料库问答系统是从预先建立的大规模真实文本语料库中查找答案。这类问答系统无法涵盖用户所有类型提问的答案,却能够提供一个优良的算法评测平台;基于网络的问答系统是从互联网中查找答案,是在真实环境下研发的问答技术;单文本问答系统,也可以称为阅读理解式问答系统,是从一篇给定的文章中查找答案,在“阅读”完一篇文章后,根据对文章的“理解”给出用户提问的答案;基于结构数据库的问答系统是从一个预先建立的结构化数据库中查找提问的答案,可以具有较强推理能力,其设计重点在于构建大规模的结构知识库。
3 代理式数字参考咨询系统特征及主要流程
3.1 代理式数字参考咨询系统特征
在网络信息环境不断成熟和发展的背景下,用户在查询信息的过程中越来越希望能够通过一站式、易用的、自助的Google式信息服务来获得问题求解,而只在必要时寻求帮助。代理式数字参考咨询系统应运而生。代理式数字参考咨询能够突破人员、地点、时间的限制,具有启发和引导功能,用户通过与系统顺畅地交互可以得到启发和帮助,从而解决问题。代理式数字参考咨询系统的特征主要表现为:启发性、开放性、个性化和协同性。
3.1.1 启发性 代理式数字参考咨询系统通过用户与系统的启发式交互产生咨询答案,事实上这是一次检索查询不断反馈和优化的过程。这里的启发是指在解决问题过程中根据问题的特点,加入一些具有启发性的信息,加速问题的求解过程。与传统参考咨询的工作机制不同,代理式数字参考咨询从提交查询表达式到最后得到满意准确答案的过程中,有一个不断形成新答案集的索引。该索引是基于已有信息内容的智能分析结果和根据其不同描述维度自动聚类生成内容类别的行为。因而整个代理式数字参考咨询的过程是人与机器之间不断交互的过程。
3.1.2 开放性 数字信息资源是代理式数字参考咨询为用户提供自助化信息服务的基础。在网络环境下,咨询服务的信息源是种类繁多的数字资源,它们拥有传统信息源无法比拟的信息量,为代理式数字参考咨询奠定了坚实的数据基础。面对用户多变、跨域、复杂的问题,代理式数字参考咨询系统需要建立开放性的底层资源架构,使得新资源能够不断补充,同时并不增加前端用户咨询的查找负担。
3.1.3 个性
文档评论(0)