相似度模型在主观题自动阅卷中应用.docVIP

相似度模型在主观题自动阅卷中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相似度模型在主观题自动阅卷中应用

相似度模型在主观题自动阅卷中应用   摘要:本文通过分析网络考试系统中主观题的特点以及教师阅卷思维方法,提出了使用相似度对主观题自动评分的方法,详细介绍了算法的设计与应用。通过实例分析,表明该算法能够有效提高主观题阅卷的准确度与效率。 关键词:相似度 主观题 自动阅卷 中图分类号:TP391.6 文献标识码:A 文章编号:1007-9416(2013)05-0077-02 1 引言 从试卷题型来看,考试题可以大致分为客观题和主观题两大类。客观题有标准的答案,可以由计算机自动判断评分。而对于考察学生综合分析能力的题目如问答题、论述题等主观题型,由于学生的表达方式、思维习惯等不同,而且汉语中存在大量的同义词、近义词、否定词等,使得考生阐述观点时所使用的词语或者句子论述的前后顺序与标准答案存在一定的差别。如果只根据标准答案评分,会使得考试结果不够客观公正。因此在设计主观题阅卷算法时,应该充分考虑到相近词、相关词和句子结构对评分结果的影响。 2 相似度阅卷算法设计与应用 2.1 算法的流程与设计 主观题自动阅卷的思想是:根据试题库中的标准答案,分析与关键词近义、相关的词语,或与标准答案句子结构和表述顺序不同的语句,作为备选答案,添加到数据库中。系统在自动阅卷时,可以将考生答案与标准答案、备选答案一起做为参考答案分别做比较,计算相似度,最后按照相似度最高的答案,将其与学生答案进行对比计算,得出的结果作为考生的得分。 为了降低阅卷过程的复杂性,阅卷时首先要将试题库中的参考答案和考生答案同时进行预处理,具体做法如下:(1)将复杂句变为简单句,将简单句变为主谓宾结构;(2)将所有标点符号去掉;(3)将副词助词如“非常”、“的”、“啊”等与相似度计算无太大关联的词语去掉;(4)句中出现多个否定词的情况下,计算否定词的个数,否定词出现偶数次,则去掉所有否定词,否定词出现奇数次,则保留一个否定词。 根据上述思想,网络考试系统中主观题自动阅卷模块实现的流程为:(1)对考生答案将学生答案拆分为句子,进行分句处理;(2)对学生答案中的子句进行分词处理,将答案中字句抽取出关键词组成序列后标记词性;(3)对学生答案中的子句进行分析,得出语义树,再根据特定的规则语义树中的关键词汇抽取出来;(4)将考生答案与题库中的标准答案和备选答案进行相似度计算;(5)选取相似度最大的答案与考生答案进行模糊数学中的单向贴近度计算,再根据参考答案中各语句的权值加权求和得出考生的最终得分。 综上,将试题库中的参考答案与考生答案分别预处理之后,表示为词汇(词串)的集合形式,分别记为A={Wa1,Wa2,…,Wan}和C={Wc1,Wc2,…,Wcn}。另外,将相似度记为S=(Wai,Wcj),由此,得出参考答案与标准答案的相似矩阵: 2.2 算法的应用 选取“Java语言程序设计”课程的一道简答题,测试该算法的可行性。 题目为:Q=“继承有哪些优点和缺点?” 标准答案1为:A1=“优点:提高程序代码的可重用性;提高系统的可扩展性;缺点:如果继承树非常复杂,或者随便扩展本来不是专门为继承而设计的类,反而会削弱系统的可扩展性和可维护性。”(70个字符); 标准答案2为:A2=“优点:增强程序代码的可复用性;提高系统的可扩充性;缺点:若继承树很复杂,或随意扩充本来不是特别为继承设计的类,反而会减弱系统的可扩充性和可维护性。” 学生答案为:C=“优点:代码的可复用性高;可扩充性强;缺点:若继承树很复杂,则会减弱系统的可重用性和可扩充性。” 将参考答案与考生答案预处理之后: 标准答案1为:A1=“优点提高代码可重用性系统可扩展性缺点继承树复杂扩展不是为继承设计类削弱系统可扩展性可维护性。” 标准答案2为:A2=“优点增强代码可复用性提高系统可扩充性缺点继承树复杂扩充不是为继承设计类减弱系统可扩充性可维护性。” 学生答案为:C=“优点代码提高可复用性增强可扩充性缺点继承树复杂减弱系统可重用性可扩充性。” 这里分别抽取各标准答案与考生答案的关键词,如下: 标准答案1:K1=“优点”,K2=“提高”,K3=“可重用性”,K4=“可扩展性”,K5=“缺点”,K6=“继承树”,K7=“复杂”,K8=“扩展”,K9=“不是”,K10=“继承”,K11=“类”,K12=“削弱”,K13=“可扩展性”,K14=“可维护性”。 标准答案2:K1=“优点”,K2=“增强”,K3=“可复用性”,K4=“可扩充性”,K5=“缺点”,K6=“继承树”,K7=“复杂”,K8=“扩充”,K9=“不是”,K10=“继承”,K11=“类”,K12=“减弱”,K13=“可扩充性”,K14=“

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档