SQuAD上问题回答：基于BiDAF模型实现与优化.pdfVIP

下载本文档

0
0
约3.85万字
约 32页
2026-01-19 发布于北京
举报

SQuAD上问题回答：基于BiDAF模型实现与优化.pdf

SQuAD上的问题回答

BelizGunel电气工程系斯坦福大

学bgunel@stanford.edu

CaganAlkan电气工程系

斯坦福大学

calkan@stanford.edu

在本文中，我们实现了双向注意力流（BiDAF）模型[1]并对建模层和超参数进

行了若干调整以提高性能。我们的单一模型在测试集上达到了78.3%的F1分数，

69.2%的EM分数，并在班级榜上具有竞争力。与原始的BiDAF单一模型实

现相比，我们的EM和F1分数更高。

1引言

阅读理解是一项流行的问答任务，系统尝试通过选择相应段落中的文本范围来提

供关于给定上下文的查询的正确。如果成功，这将在虚拟助手和自动客户服

务等许多实际应用中发挥作用。它也可以作为衡量NLP系统如何理解各种文本的

研究工具。为了促进这一任务的发展，斯坦福NLP小组发布了斯坦福问答数据集

（SQuAD）[2],，这是一个包含超过10万对问题‑及其对应的来自百科的

上下文段落的阅读理解数据集。SQuAD公开榜上最成功的系统通常使用某种

注意力机制来专注于上下文的一小部分并对其进行总结。

在这个项目中，在给定的基线之上，我们实现了BiDAF网络，该网络在不进行早期总结的

情况下，建模查询感知的上下文段落表示。BiDAF利用字符级、单词级和上下文嵌入。我

们对原始的BiDAF网络进行了几项修改以提高性能，这些将在第3节中详细描述。

QuestionAnsweringonSQuAD

BelizGunel

DepartmentofElectricalEngineering

StanfordUniversity

bgunel@stanford.edu

CaganAlkan

DepartmentofElectricalEngineering

StanfordUniversity

calkan@stanford.edu

Inthispaper,weimplementBidirectionalAttentionFlow(BiDAF)model[1]andmake

severaladjustmentstomodelinglayersandhyperparameterstoincreasethe

performance.Oursinglemodelachieves78.3%F1,69.2%EMonthetestsetandhasa

competitiverankontheclassleaderboard.WealsohavehigherEMandF1scoresthan

theoriginalBiDAFimplementationwithsinglemodel.

1Introduction

ReadingComprehensionisapopularQuestionAnsweringtask,wherethesystemtries

toprovideacorrectanswertoaqueryaboutagivencontextthroughselectingthespan

oftextinthecorrespondingparagraph.Ifsuccessful,thiswillhavemanypractical

applicationssuchasvirtualassistantsandautomatedcustomerservice.Itcanalsobe

usedasameasureofhowwellNLPsystemscanunderstandvarioustextsforresearch

studies.Inordertofacilitatetheprogressinthistask,StanfordNLPgroupreleasedthe

StanfordQuestionAnsweringDataset(SQuAD)[2],areadingcomprehensiondataset

whichhas

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

SQuAD上问题回答：基于BiDAF模型实现与优化.pdfVIP