考试成绩的相关性分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
考试成绩相关性分析的实用性研究 孟宪武 (周口市招生办公室 466000) 摘要:根据对长度为?n?的两个序列之间相关系数分布规律的理论探讨,本文得 出相关系数的分布为正态分布且方差为?1/n?的结论,并用以找出大规模考试中 成绩记录整场出错的考场。通过对考生成绩的相关性分析,根据相关系数即可 迅速锁定可能出错考场,使得只需要抽检不到?0.5%的考场,即可基本上找出全 部整场出错的考场,从而提高了校对审核的效率。 关键词:相关系数?大规模考试?错误检查 中图分类号:C8 文献标识码:A 作者简介:孟宪武?河南周口市招生办,高级程序员。 1?问题的提出 目前,全国性和地方性的大规模考试非常普遍,如普通高招、中招、自学 考试、高中会考,还有许多行业的考试、资格考试等。大部分考试采用主观试 卷方式或主观试卷与客观试卷相结合的方式。为了保证评卷和登分过程的客观 公正,在对主观试卷评卷和登分的过程中,通常采用对考场号加密的方式进行。 即在整个评卷和登分过程中,隐去每场试卷的原始考场号而改用考场密码,待 评卷、登分、复核等过程结束后,再根据密码与考场对照表转换成实际考生成 绩,所有评卷、登分和复核人员只能见到考场密码而无法知道实际考场号。这 样做的好处是从技术上保证了评卷的公正性,但也带来一个非常大的问题:如 果在对试卷更换密码的过程中,将两场试卷的密码颠倒或多场密码串位,或在 试卷运转过程中密码丢失、出错,必然会导致一个考场甚至多场考生成绩整体 出错。由于这些考试的考场数量巨大,整个评卷登分的环节又比较多,因此这 种密码出错的情况很难避免。如果这种错误不能及时得到纠正,必将大大增加 后续校对审核的工作量。笔者通过对考生考试成绩的分布规律的研究,根据相 关性分析原理,在登分结束后,对每个考场成绩分布情况进行相关性分析,并 根据相关系数迅速锁定有可能整场出错的考场,大大提高了校对审核的效率。 2?相关性分析的基本原理 2.1?两个序列的相关性 假设有两个序列: X:?x1,x2,?,xn Y:?y1,y2,?,yn 根据统计学原理,两序列之间的相关系数 r?? 2σ?xy 2 σ?xσ?y -100.10.20.30.40.50.60.70.8-0.9-0.8-0.7-0.6-0.5-0.4-0.3-0.2-0.10.9式中 -1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.9 2σ?xy?=?? 2 (xi-x)(yi-y) n ?(x?-x) ?(x?-x) ?(y?-y) σy?? i n i n 2 2 ??xi?yi-?? in? i? ??xi?yi-?? in? i ????x2-?? i ?????y2-?? i ? ? ?? ? ? ?? ? 由于相关系数的基本公式不易计算,可从基本公式导出以下的计算式 x y r?? ? ( x?)2??? ( y?)2?? n n 相关系数?r?的取值范围为?1≥r≥-1,r?的各种取值的意义为: r=1,序列?X?和?Y?是线性正相关; r=-1,序列?X?和?Y?之间是线性负相关; r=0,序列?X?和?Y?之间不相关; 1r0,序列?X?和?Y?之间正相关,r?越大相关度越高; 0r-1,序列?X?和?Y?之间负相关,r?越接近-1?负相关度越高。 2.2?相关系数?r?与样本个数?n?之间的关系 将通过?n?个样本计算出的相关系数记为?rn?。理论上讲,只有当样本个数?n 趋于无穷大时所得到的?r??才能真正表示两个序列的相关程度。当样本个数为有 限时,?rn?的值会在?r??附近波动,n?越大则?rn?与?r??的偏离程度越小。由于通过数 学公式导出?rn?分布的解析式非常复杂,下面,用蒙特卡罗方法来研究?rn?的分布 规律(为简便起见,只研究两个不相关序列的相关系数分布情况)。 由计算机产生两个相互无关的随机序列(记为一组) X:?x1,x2,?,xn Y:?y1,y2,?,yn 由于两序列是无关的, 理论上讲其相关系数?rn?应为 0,实际上,当样本个数?n 为有限值时,?rn?不一定为 0,而是一个在?0?附近的随 18 16 14 12 10 8 6 4 2 0  n=100 n=50 n=30 机数。由计算机产生?M?组 随机序列,即可得到?M?个  图?1?50000?组不相关随机序列的相关系数分布 rn?,其分布如图?1?所示(M=50000): 图中,当?n=100?时,?|?rn?|?0.1655?的概率为?90%,?|?rn?|?0.1964?的概率为 95%,??2?=0.0101; 当?n=50?时,?|?rn?|?0.

文档评论(0)

xiaoluping2000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档