一种基于短文本相似度计算的主观题自动阅卷方法.PDF

下载文档

262
0
约3.27万字
约 8页
2018-10-02 发布于天津
举报
版权申诉
保障服务

一种基于短文本相似度计算的主观题自动阅卷方法.PDF

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

一种基于短文本相似度计算的主观题自动阅卷方法

第５８卷第１９期　２０１４年１０月一种基于短文本相似度计算的主观题自动阅卷方法 ■ 张均胜　石崇德　徐红姣　高影繁　何彦青［摘　要］文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法，提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法，设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库，并在３８７道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示，文本试题自动阅卷结果与人工阅卷结果相比，完全相同的达到５８％，准确率达到８０％左右。［关键词］短文本　相似度　主观题　自动阅卷［分类号］ＴＰ３９１．１　　ＤＯＩ：１０．１３２６６／ｊ．ｉｓｓｎ．０２５２－３１１６．２０１４．１９．００５１　引　言文档相似度，本文称之为短文本相似度计算。　　文本题目自动评卷系统需有机嵌入现有考试和评　　考试作为对学习效果和知识掌握程度的一种检验分系统。主观题只是考试内容的一部分，因此自动评方法，在日常工作和生活中广泛存在。由于各类培训卷功能作为考试评价的一部分，无需一个单独的系统，考试人数较多、规模较大，教育和培训机构对于自动阅而是要作为现有考试评分系统的一个子系统或者后台卷的需求日趋强烈。培训考题分为客观题和主观题两运行的服务程序。在发出自动评分指令后，该子系统类。客观题表现为选择题和判断题，该类试题答案形或程序应能够自动批量地对主观题评卷，结果按照现式唯一且明确，自动阅卷比较容易。而针对简答题和有系统评分结果所需数据格式返回。自动评卷系统要论述题等主观题，自动阅卷却有相当的难度。考试试能够嵌入到现有考试系统，且有单独的主观题评分查题中有较多主观题，由于考试规模大、考生人数较多，询界面，便于对自动评分结果进行审核和校正。并且考试专业和内容各不相同，导致主观题人工阅卷　　针对短文本的相似度计算，与词语之间相似度、句时分发和评分工作量巨大，费时费力，而且人工阅卷中子之间相似度和文本之间相似度紧密相关。对于短文会有很多的主观因素影响评分结果，如教师的疲劳程度、心情状态以及考生的字体是否美观等。因此，需要本的相似度计算，一种是通过人工判断的方法，另外一采用计算机自动阅卷技术加快阅卷速度，并保持较好种是对文本自动进行相似度计算。针对文本的相似度的评分客观性。计算，则可以分为统计角度的相似度计算和语义角度　　文本主观题阅卷自动化的关键是提高考生答案文的相似度计算两种类型。本和试题标准答案文本之间相似度计算结果的准确　　单纯的人工判断对于文本主观题的自动阅卷没有率。本文研究短文本相似度计算的目的是开发主观题意义，但是完全的自动化阅卷由于缺少背景知识、考试自动阅卷系统，以减少人工阅卷的工作量，并保证较好答案文本较短以及大规模试题语料库缺失等原因而不的自动评分质量。由于简答题和论述题的答案通常由现实。为此，需要研究人工制定文本相似标准和自动