- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
QuestionAnsweringSystem 技术实现
@mr.cc
1
QuestionAnsweringSystem 是一个Java 实现的人机问答系统,能够自动分析
问题并给出候选答案。本文从工作原理、主要数据结构、关键技术及代码实现四
个方面对该系统的技术实现进行分析。
1、工作原理
本地数据库 是
问题输入 本地数据库
是否存在证据?
否
预处理 从互联网检索
并抽取问题的证据
添加问题,证据
检索并返回问题的证据
提取问题模式 支持证据
问题类型 模式匹配得到
证据评分
模式集合 问题类别
候选答案提取
TopN答案
候选答案评分 候选答案排序
及其置信度输出
图 1 QA 系统工作原理
该QA 系统的工作原理如图 1 所示,主要可以划分为证据获取、证据评分、
问题分类、候选答案评分四大模块。这四大模块的目标及内容如下:
证据获取:从本地数据库或互联网上获取支撑问题的证据。若本地数据
库存储有该问题的证据,则直接返回支撑问题的证据。否则,需要利用
搜索引擎 (如百度、谷歌)从互联网上抓取与该问题相关的片段,并抽
取、整理出其中的正文作为该问题的支撑证据。
证据评分:为评价不同证据对问题的支撑度,需建立一套证据评分机制。
1 项目作者:杨尚川;项目地址:/ysc/QuestionAnsweringSystem
- 1 -
证据评分模型,采用了基于词频的、基于 bigram 的和基于 skip-bigram
的三种评价方法及基于上述三种方法加权的组合方法。评分过程中,可
以由用户设定以上四种评价方法的任意一种。
问题分类:对问题所属的类别进行判定。该系统将可识别的问题类别划
分为人名、地名、机构名、数字、时间、定义和对象七类(暂时仅支持
前五类),并预先定义这几类问题的匹配模式。分类过程为:1)提取问
题的模式,2 )和预定义的问题类型模式进行正则匹配,3 )根据匹配的
结果确定问题的类别。针对同一类问题,系统又定义了五大类数小类的
匹配模式,用户可以自由设定匹配模式为大类别或基于五大类的加权组
合。
候选答案评分:为评估候选答案的质量,需建立一套候选答案评分机制。
在候选答案评分模型中,基础的评价方法有基于词频的、基于词距的、
基于最短词距的、基于文本对齐的、基于宽松文本对齐的、基于回带文
您可能关注的文档
最近下载
- 生物安全实验室乙型肝炎病毒实验活动风险评估报告.docx VIP
- 2025年全国中考历史真题分类汇编.docx VIP
- 托福写作172句型.doc VIP
- 三级助听器验配师理论知识考核试题及答案.pdf VIP
- Unit 7 Happy Birthday第1 Lead-in Cartoon time三年级英语上册练习(译林版三起).pdf VIP
- 昌平区电力工程施工组织设计.doc VIP
- 2025年新人教版数学二年级上册全册课件.pptx
- T∕CCMA 0075-2019 -装载机载荷谱试验方法.pdf VIP
- 针灸入门广州中医药学PPT.ppt VIP
- 学堂在线 如何写好科研论文 章节测试答案.docx VIP
文档评论(0)