基于指针深度学习机器阅读理解.docVIP

下载本文档

20
0
约4.03千字
约 7页
2018-08-29 发布于福建
举报
版权申诉

基于指针深度学习机器阅读理解.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于指针深度学习机器阅读理解

基于指针深度学习机器阅读理解　　摘要： ?P键词：中图分类号：文献标志码： A文章编号： 2095-2163（2017）06-0157-04 　　Abstract： Understanding text is the ultimate goal for machine reading comprehension task. The understanding ability of machines can be evaluated by the accuracy of question answering for specific document. The paper proposes a deep learning model and applies it to span extraction based machine reading comprehension. The model encodes the document and question with Recurrent Neural Networks and then performs information interaction with attention mechanism. Finally， the answer can be selected by predicting the start and end position in the source document. The proposed model performs better than manual features based conventional methods and obtains 53.1% F1 and 39.6% EM. 　　0引言　　自然语言理解作为一个终极的人工智能目标，极具现实挑战性，而且让机器理解语言的意义也是非常重大的。从学术研究的角度来看，这是学术研究的最前沿，代表着机器在当今时代可能达到的最高智能水平。从工业界的视角来看，对搜索引擎、聊天机器人、私人机器助手等重要产品都有直接的应用创新进展，拥有可产生巨大商业价值的发展空间。近年来，深度学习发展迅速，以深度学习为基础的模型在图像处理、自然语言处理、语音识别等研究领域已经取得了广泛的应用和良好的效果，并且其自动抽取特征的能力极大地降低了人工的参与。　　阅读理解作为常见的一种题型，对于绝大多数人来说都不陌生，在中考、高考的语文和英语科目中非常普遍。机器阅读理解任务类似地包含原文、问题和答案，目标就是让机器阅读给定的原文和问题，得到正确的答案，与面向人类的阅读理解要求是一样的。本文以片段抽取型机器阅读理解数据集SQuAD[1]为基础，应用深度学习方法，使用多层基于注意力的方式对原文和问题进行交互，最后通过类似PointerNetwork[2]的机制来预测答案的边界。　　1基于深度学习的实验方法　　随着计算能力的不断提升，基于深度学习的复杂机器阅读理解模型是现在的主流方法，其效果已经超过基于特征工程的传统方法和浅层的深度学习模型，并且注意力机制的引入更是显著可观地提高了深度学习模型的效果。　　2实验数据与评价指标　　2.1实验数据　　SQuAD数据集由Rajpurkar[1]发布在EMNLP2016上，获得该会议2016年的最佳资源奖，是机器阅读理解领域里颇具代表性的大规模数据集，其中每个样例包括原文、问题和答案，其中问题一定与原文相关，并且答案是原文中的一段文本，如图1中加粗部分所示。　　研究中，采用众包的方式基于536篇Wikipedia文本构建了107 785个问答对，数据集的主题也很丰富，包含音乐名人、抽象概念、历史事件等类别。质量和难度上较之前数据集更呈明显优势，而且也更具有挑战和研究价值。　　由于该数据集的测试集并不公开，基于方便实验的考虑，本文将开发集中部分数据划分为测试集进行实验，划分后的数据集规模如表1所示。　　分析模型预测答案的准确程度与答案长度之间的关系，统计测试集上不同答案长度对应的平均F1值和EM值，如图2基于答案长度的统计所示。当答案长度较短时，模型能够准确地预测答案，并且EM值与F1值相差不多，但随着答案长度的增加，预测的准确程度出现下降趋势，并且EM值比F1值受长度影响更大，答案越长则使预测答案与标准答案完全相同就越发困难。　　分析模型预测答案的准确程度与问题类型之间的关系，本文通过问题中前两个词是否包含特定疑问词，将问题分为8类，统计测试集上不同问题类型对应的平均F1值和EM值，如图3所示。可以看到模型在When和Who两类事实型问题上表现最好，说明模型通过计算问题和原文的相似性，能够准确地在原文中找到事实类问题的答案。但