网站大量收购独家精品文档,联系QQ:2885784924

基于预训练语言模型与实例检索增强的作文自动评分研究_.pdfVIP

基于预训练语言模型与实例检索增强的作文自动评分研究_.pdf

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

作文自动评分是自然语言处理在教育领域的重要应用之一,相比人工评分方

式其具有节省人力物力和消除评分主观性等优点,研究意义重大。作文自动评分

模型主要包括表示模块和评分模块,对于表示模块,之前的研究主要使用循环神

经网络和卷积神经网络来提取作文表示。然而,现有的方法中,使用预训练语言

模型的方法实验效果并不理想,没有充分利用预训练语言模型的优势来学习作文

的有效表征。至于评分模块,目前尚未有深入的研究,大多数方法仅使用排序损

失函数来影响评分过程,缺少其他方面的探索。针对以上问题,本文基于这两个

模块分别提出新的方法,主要展开如下研究。

(1)对于作文表示模块,本文提出一种基于预训练语言模型的作文自动评分

方法,目的是充分挖掘作文中所蕴含的语言知识,提取作文的有效表征,帮助模

型更好地理解作文的语义信息。该方法主要利用预训练语言模型所学习到的丰富

语言表示,分别提取作文的篇章级别表征和词汇级别表征,并基于此对作文进行

分数预测。本文还借鉴了预训练语言模型中迁移学习的思想,在源作文提示上进

行评分预训练,在目标提示上微调,从而有提高作文数据的利用率。本文在作文

评分数据集ASAP上进行了充分的实验,并取得了不错的评分效果,验证了本文所

提出模型的有效性。最后对模型中各模块进行消融实验,并探究不同的预训练语

言模型对本文所提出模型的适配程度。

(2)对于作文评分模块,本文提出一种基于实例检索增强的作文自动评分方

法,目的是强化作文评分的过程,从而提升模型评分性能。该方法主要利用实例

检索及实例间的信息交互,挖掘出更多作文实例间所蕴含的关系信息,在评分过

程中起到信息增强作用。该方法包含编码模型和检索增强模型,编码模型主要用

来学习训练集中作文的向量化表示并将其存入向量数据库,便于检索增强模型进

行检索。对于检索增强模型,根据输入作文可以检索得到相关的作文实例向量,

进行信息交互之后再预测出对应的分数。同时本文还提出了几种不同的实例检索

策略,检索时可根据不同的策略来检索到相关的作文实例向量。本文在ASAP数据

集上进行了充分的实验,在8个作文提示下的平均QWK达到了0.793,优于绝大

多数作文自动评分方法,并验证了实例检索增强的有效性以及检索策略的合理性。

关键词:作文自动评分;表示模块;评分模块;预训练语言模型;检索增强

I

Abstract

Automatedessayscoringisoneoftheimportantapplicationsofnaturallanguage

processinginthefieldofeducation,whichhastheadvantagesofsavinglaborandmaterial

resourcesandeliminatingthesubjectivityofscoringcomparedwithmanualscoring,sothe

researchisofgreatsignificance.Theautomatedessayscoringmodelmainlyconsistsofa

representationmoduleandascoringmodule,fortherepresentationmodule,previous

studiesmainlyuserecurrentneuralnetworksandconvolutionalneuralnetworkstoextract

theessayrepresentation.However,theexperimentalresultsoftheexistingmethodsusing

pre-trainedlanguagemodelsarenotsatisfactoryanddonotfullyutilizetheadvantagesof

pre-trainedmodelstolearneffectiverepresentationsofcompositio

文档评论(0)

n1u。 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档