主观题自动评阅算法设计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主观题自动评阅算法设计

主观题自动评阅算法设计   摘要:主观题自动评阅是智能化考试系统中的难点,由于文本层次结构的复杂性,表述方式的多样性,词语词义的丰富性,使得计算机自动评阅的准确性很难达到人工评阅的水平,本文提出了一种基于模糊贴近度匹配法的主观题自动评阅算法。并通过实验证明其算法的优良性。   关键词:多样性 模糊贴近度 自动评阅   中图分类号:TP301.6 文献标识码:A 文章编号:1007-9416(2013)09-0116-02   随着网络的普及,在线考试快速高效,具有广阔的应用发展前景。客观题自动评阅技术已经相当的成熟,也得到了广泛的应用,但是主观题的评阅由于涉及语义分析、分词技术、人工智能等相关技术,因而发展比较缓慢。本文利用答案的相似度以及相似度所占的权重,来计算考生的最终成绩。这种思想符合人的思维方式,增强了计算机评阅客观题的高效性。   1 相关概念   对标准答案与考生答案中的关键词进行比较,考虑用字符串的形式表示关键词。这两者之间的匹配用相似度来表示。   将一个字符串分解为关键几个字符,并把所有关键词构成的集合称为一个论域,用U={u1,u2,u3,…,un}表示,论域上的子集所组成的集合用F(U)表示。   设U={u1,u2,u3,…,un},A,B∈F(U)。若映射:F(U) F(U)→[0,1],   满足条件:   (1)(A,A)=1   (2)(B,B)=1   (3)若ABC或ABC,则(A,B)≥(A,C)称(A,B)为A贴近于B的单向贴近度。   定义2:   设A、B是字符串,A中包含n个字符,(A,B)表示A贴近于B的单向贴近度,按照从左到右的顺序,集合A中的每个元素在集合B中出现的有效次数和记为m,则(A,B)=m/n.   定义3:   相似度匹配系数定义如下   SMC=/总属性个数   SMC值越大,得分越高。   2 算法思想   人工评阅主观题时,首先检查学生答案中的得分点,得分点多则对应学生的成绩就高,其次看学生答案和标准答案的相似度,相似度高则分数就高,最后再考虑语义是否正确,再适当对分数进行调整。从上面阅卷过程中看,影响评分最重要有三个因素:第一就是得分点,第二就是相似度,第三就是语义正确。可以按得分点给出每道题目的得分高低。每个得分点就是一个关键字,关键字的相似度可以采用数据挖掘中语义相似度的方法进行描述,再根据相似度的权值,计算最终成绩。   根据上述分析,可以构建主观题自动批阅的流程图。   3 算法设计分析   分词结束后可进行相似度的计算,为计算中文关键字的接近程序,引入单向相似度概念。以a和b字符串为例介绍a相似字符串b的单向相似度。计算步骤如下   (1)对字符型数据和汉字进行单双字节的判定,然后排成字符序列。   (2)判断a字符串中的字符是否出现在b字符串中,是标记为1,否标记为0。   (3)计算单向相似度:a与b的单向相似度计算为:a中分解的单字符在b中出现的次数之和占a中总有效字符数之比。   (4)根据上述思想,设计Similarity用于计算两语句的单向相似度   class Similarity{   double m = 0.00;//向量1的模   double n = 0.00;//向量2的模   double t = 0.00; //向量积   Iterator iter = vectorSpace.entrySet().iterator();   while(iter.hasNext()) {   Map.Entry entry = (Map.Entry)iter.next();   itemCountArray = (int[])entry.getValue();   m += itemCountArray[0]*itemCountArray[0];   n += itemCountArray[1]*itemCountArray[1];   t += itemCountArray[0]*itemCountArray[1];   }   m = Math.sqrt(m);   n = Math.sqrt(n);   return (t/(m*n)); //返回相似度   }   通过单向相似度的计算,在将关键字的权重考虑进去,即可得到主观题的评阅公式:   式中各符号的含义如下:   :学生的实际得分.:试题的分值.:学生的实际答案. :试题的标准答案.   :关键词在该题目中所占分值的比例;:关键词的个数.   :第个关键词;:第个关键词与学生答案的单向贴近度;   :关键词与学生答案的单向贴近度阀值。   4 结语   主观题自动

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档