基于关键词覆盖主观题自动批改技术设计和实现.docVIP

下载本文档

11
0
约6.88千字
约 15页
2018-08-29 发布于福建
举报
版权申诉

基于关键词覆盖主观题自动批改技术设计和实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于关键词覆盖主观题自动批改技术设计和实现

基于关键词覆盖主观题自动批改技术设计和实现　　[摘要] 主观题的批改一直是实现无纸化考试系统中的一个非常重要的关键技术。本文避开了常见低效的语义相似批改模式，尝试使用一种基于关键词覆盖的方法来模拟教师评判主观题的思维过程，引入了给分点覆盖区域及其可信度等概念，设计了一套新的主观题的批改方法，并给出了相关的算法。　　[关键词] 无纸化考试；主观题；自动批改；给分点覆盖区域　　[中图分类号] G434 [文献标识码] A 　　[作者简介] 孙发勤（1976―），男，江苏东台人。讲师，硕士，主要从事智能教育系统的研究、设计与开发。E-mail:yzu.sun@163.com。　　一、概述　　随着教育思想的更新和科学技术的进步，以纸和笔为主要工具的传统考试方式的诸多弊端显露得越来越突出，如效率低、出卷繁琐、阅卷麻烦，在判卷过程中每位教师的评分标准不尽一致，对于主观题的评分可塑性大、保密性差、无法激活应考者的兴趣并给学生增加了考试压力等等。[1][2]在科学技术飞速发展的今天，计算机以其高效、灵活、便捷的特点，渗透到社会的每一个角落，随着计算机技术的应用及普及，现代教育考试制度也发生了深刻的变化，无纸化考试逐步应用及推广取代有纸化考试，即由计算机管理系统对考试的题库、组卷、组考、阅卷评分和统计分析进行统一管理，对考试的科学化、规范化管理和实现真正意义上的教考分离，对检查教学效果、检测学生掌握知识的情况、减轻教师负担、提高效率都具有重要意义。[3]而实现无纸化考试的一个非常重要的技术难点就是如何提高主观题的批改正确率，解决好了主观题的批改问题就在一定程度上解决了无纸化考试。　　在答主观题时一般采用语言叙述的方式，而每个人对知识的理解程度不同，表达方式也不一致，即便考生的答案准确，也很难与标准答案完全一致，若要像对客观题评分那样准确地对主观题进行评分几乎是不可能的。[4]通常的做法一般都是从语义或简单的关键词匹配的角度入手分析考生的答案。这些方法对于答案文字数量不多的题目（如名词解释等）有一定的效果。但对于简答或论述这类的题目，考生的答案往往比较复杂，这时候如果使用上述方法就会出现如下问题：用标准答案中的某个关键词要和考生答案中的哪句或哪几句中的关键词来进行比较？用标准答案中某个答案要点和考生答案中的哪句或哪几句来计算语义的相关度？诸如此类的问题就比较难以确定。　　纵观教师批改试卷的过程，可以发现，阅卷的基本思路如下：首先教师到考生答案中寻找“给分点”（这些给分点往往就是一些比较重要的关键词），再看看该“给分点”左右的一些其他关键词，最后考察一下整体的答题情况给出一个分值。也就是说关键词的分布在很大程度上决定了考生答案的基本分值。由此，本文设计了一套基于关键词覆盖的方法来尝试模拟改卷教师的这种思维活动。经过测试，该方法基本能满足医学主观题的批改要求。　　二、算法思想分析　　在医学教育中,教师对学生的用词往往非常严格，对于一个概念的描述往往只有一个或几个固定的规范词。因此可以把主观题的标准答案分解为一个或多个给分点，对某个给分点用一个或多个关键词来描述。然后在医学领域，对这一组关键词进行扩展，得到一组同义关键词组。这样可以用扩展的给分点的关键词组来分析考生的答案。　　在实现该算法之前，有一个假设和一个前提。　　前提：把标准答案分为一个一个的给分点，然后用相应的关键词来描述给分点。　　假设：学生用一句或相邻的几句话来回答一个给分点。　　批改考生答案时，把某一个给分点的同义关键词组一起放入考生的答案中进行匹配，这样则会找到一个出现这组同义关键词相对密集的地方，根据上面的假设，这个区域应该就是本给分点所对应的学生的答题区域。找到的这个区域可信度有多少？可以通过将该区域分块，由各块中分析关键词组出现的密度来确定。如果各分块中关键词组出现的密度比较均匀，则认为该区域是可信的，否则应该缩小区域以提高区域的可信度。得到可信度较高的区域后，再通过分析该匹配区域中关键词组的出现频率来度量考生答案和标准答案的贴近程度。当然也可以把这个区域的内容提取出来，使用关键词结合浅层语义分析来得出本给分点考生的得分情况。而对于整体的答题情况，可以通过分析各个给分点的匹配区域的重合度来反映考生对考题的理解。如果各给分点的匹配区域的重合度高，则反映考生对该题理解比较模糊；如果重合度低，则反映考生对该题理解比较清晰。如图1所示。　　三、算法设置　　批改医学主观题主要分为以下几个步骤: 　　1. 答案切分　　把标准答案分解成一组给分点的集合。每个给分点用一组关键词来描述。通过使用特定的关键词库先把用户的答案切分为关键词组的集合。　　例如有一道简答题，题干是“糖皮质激素长期大量应用引起的不良反应”，答