- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
短文本相似度计算在用户交互式问答系统中的应用计算机系统结构专业论文
摘要摘要
摘要
摘要
随着互联网的迅速发展和W曲2.0概念的提出,问答(QuestionAnswering) 系统逐渐成为一种新的信息检索技术。和传统的搜索引擎返回大量相关文档不 同,问答系统直接返回给用户精确的答案,从而省去了用户从大量相关的文档中 去寻找自己所需信息的时间。尽管如此,传统的自动问答系统仍然难以满足人们 的需要,这是因为机器的理解能力有限,往往不能很好的理解人们提出的问题, 因而难以产生令人满意的答案。正因为如此,用户交互式问答(User-interactive Question Answering,也叫社区问答)系统应运而生。和传统的自动问答系统不 同,用户交互式问答系统给广大用户提供了一个基于互联网的平台,使得人们可 以自由的在网上进行提问和回答,从而实现人与人之间的互相帮助。由于答案都 是由人来提供,而人的理解能力远远强于机器,因而答案的质量相比自动问答就 有了明显的提高。
短文本相似度计算在用户交互式问答系统中具有举足轻重的作用,因为问题 和答案都是短文本的形式,进行问题和答案的处理必然要涉及到对问题及答案语 义的理解及相似度的判断。短文本相似度计算在用户交互式问答系统中的应用主 要包括常见问题自动问答、问题自动分类以及答案聚类。本文围绕这几方面的应 用进行了深入研究,研究内容和创新之处如下:
首先,提出了一种基于语义空间计算问题相似度的方法来解决常见问题的自 动问答。该方法通过系统累积的问题构造一个语义空间,将问题映射到该空间中 计算问题相似度。通过语义空间,问题信息能够得到更好的表示,从而使得问题 相似度的计算更加精确。此外,该方法还通过特征聚类去除了冗余信息,提高了 计算效率。
其次,提出了一种新的基于相似度计算的问题自动分类的方法。该方法从累 积的问题集中抽取出一些重要的词(Term)作为特征来构造一个特征空间并将每 个类别用特征空间中的一个向量来表示。对于每个用户问题,首先也将其映射到 特征空间中,然后计算问题和各个类别的相似度,最终将具有较高相似度的几个 类别推荐给用户。此外,该方法还利用语义模板对问题中和主题相关的词进行识 别并增加其权重,从而更好的表示了问题信息。
最后,提出了一种有效的对同一个问题的答案进行聚类的方法。该方法按照 内容或语义将同一问题下的所有答案进行聚类。此外,还为每个类选出一个代表 性的答案提供给用户,这样用户通过这些代表答案就能快速的把握所有答案主要 的信息。该方法包含两个重要组成部分:答案相似度计算方法和聚类算法。对于
摘要答案相似度计算,提出了一种结合统计信息和语义信息的计算方法:对于聚类算
摘要
答案相似度计算,提出了一种结合统计信息和语义信息的计算方法:对于聚类算 法,提出了一种增长式的聚类算法来降低时间复杂度。
关键词:用户交互式问答系统短文本相似度自动问答问题分类答案聚类
n
AbstractABSTRACT
Abstract
ABSTRACT
With the dramatic development of the Interact and the emergency of Web 2.0,Question Answering(QA)becomes new Information Retreival(IR)technology.Unlike search engines which return few relevant documents,QA systems give several exact answers for each question,which is more preferable.However,traditional automatic QA systems suffer from poor answer qual ity problem because it is very difficult for machine to understand human’S
question well.To solve this problem,User-interactive QA systems have been developed and become very popular Web—based service.Unlike the traditional automatic QA systems which totally obtain answers automatically,the user-interactive QA systems interactive
platforms for to help each other with human—provided answers,which overcome the sh
您可能关注的文档
- 工作流技术在工程项目管理中的应用研究计算机软件与理论专业论文.docx
- 当代中国公民生态文明意识的养成研究马克思主义理论专业论文.docx
- 申报自由谈与三十年代中国社会文化——以1932间的自由谈为主要研究对象中国近现代史专业论文.docx
- 贝叶斯网络在老年人普适健康监测服务中的应用研究计算机应用技术专业论文.docx
- 导师指导与研究生学术表现的关系研究高等教育学专业论文.docx
- 大鼠肾脏再灌注损伤模型肺内氧化应激状态及prxvi的表达变化人体解剖与组织胚胎学专业论文.docx
- 供应链中断风险分析及协调管理研究管理科学与工程专业论文.docx
- 多倍数学光自动聚焦系统的研究与实现控制理论与控制工程专业论文.docx
- 钒渣铵浸提钒新工艺应用基础研究化学工程专业论文.docx
- 当代中国社会转型期政府权力运行机制重塑分析科社与国际共运专业论文.docx
- 叠前近偏移距数据重构和自由表面多次波压制方法研究地球探测与信息技术专业论文.docx
- tfap2α在肾透明细胞癌中的表达及对细胞增殖和周期的影响外科学泌尿外科专业论文.docx
- 高校思想政治教育与校园文化建设的契合分析思想政治教育专业论文.docx
- 股份制商业银行品牌价值评价体系研究企业管理专业论文.docx
- βcatenin蛋白调节机制的分析临床检验诊断学专业论文.docx
- 大孔吸附树脂d101的氯甲基化及功能化改性研究材料学专业论文.docx
- 超宽带光纤放大器理论与实验研究光学专业论文.docx
- βcatenin蛋白调节机制的研究细胞生物学专业论文.docx
- 根据压缩终了缸内流场对进气系统的评价方法动力机械及工程专业论文.docx
- 股权激励计划修订权益工具定价模型选择与盈余管理的关系研究——以万科股权激励计划为例会计学专业论文.docx
文档评论(0)