面向机器人学习的对话模版抽取方法.docVIP

  • 9
  • 0
  • 约2.14万字
  • 约 30页
  • 2020-09-18 发布于江苏
  • 举报

面向机器人学习的对话模版抽取方法.doc

经典专科、本科、硕博、研究生、期刊毕业论文 仅供参考 精心整理 仅供参考 勿用作商业用途 目录 TOC \o 1-3 \h \z \u 前 言 1 第一章 绪 论 2 1.1 研究背景及意义 2 1.2 问答系统概述 3 1.3 本文的主要工作 4 1.4 本文的组织结构 5 第二章 问答系统实现方法 6 2.1 问答系统实现方法 6 2.2 问题分析 7 2.2.1问题预处理 7 2.2.2问题分类 7 2.2.3关键字提取 8 2.3 信息检索 8 2.4 答案抽取 9 第三章 问答系统算法设计 11 3.1 Lucene 11 3.2 相似度计算 11 3.2.1词向量 12 3.2.2卷积神经网络 13 3.2.3Word2vec 14 3.3 排序学习 15 第四章 模版匹配方法 17 4.1 问题模版 17 4.2 模版构建 17 4.21后缀树 17 4.22 模版获取 19 4.23 准确度计算 20 4.3 问题分类 21 朴素贝叶斯方法 21 4.4 评估方法 21 第五章 总结与展望 23 5.1 本文总结 23 5.2 后续工作展望 23 参考文献 24 致 谢 26 摘 要 问答系统的主要任务是在信息抽取文档的支持下,提供给自然语言表述的问题一个简单有效的答案,实现友好可靠的人机交互方式,现有的技术已经能够基本实现部分问答需求。在本文中,我们将讨论基本的问答系统的实现结构和工作方式,并分析一种使用模版学习的问题匹配和答案抽取方法。 问题模版通过提供一些人工问题的实例输入搜索引擎 ,建立了一个带标签的语料库,从返回的文件中抽取并标准化得。我们可以通过MRR得分评估每个模版的精准度,确定每个问题类型的回答效果。在获得高精度的模版后可以应用于匹配新问题的答案。 答案抽取的相关度计算采用基于词向量模型的排序学习方法。排序学习是机器学习的典型应用,用于构建信息检索系统的学习排序模型。 训练数据由查询得到的文档指定的部分文档列表组成。 排序学习的目的确定是在新问题提出时文档列表中已有的内容与问题请求是否有关。 关键字:问答系统;模板学习;问题匹配;答案抽取;排序学习 Abstract The major task of the question answering system is to provide a simple and effective answer to the problem of natural language expression under the support of information extraction documents, to achieve a friendly and reliable human-computer interaction, and the existing technology has been able to basically fulfill some of the questions and answers. In this article, we will discuss the implementation structure and working methods of the basic question answering system, and analyze a question matching and answer extraction method using template learning. The text pattern is obtained by providing some examples of human problems tothe search engine. A tagged corpus is created and extracted from the returned documents and standardized. We can use the MRR score to evaluate the accuracy of each template and determine the response to each question type. After obtaining a high-precision pattern, it can be applied to match the answers to new questions. The

文档评论(0)

1亿VIP精品文档

相关文档