考试成绩相关性分析实用性研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
考试成绩相关性分析的实用性研究 孟宪武 (周口市招生办公室 466000) 摘要:根据对长度为n的两个序列之间相关系数分布规律的理论探讨,本文得出相关系数的分布为正态分布且方差为1/n的结论,并用以找出大规模考试中成绩记录整场出错的考场。通过对考生成绩的相关性分析,根据相关系数即可迅速锁定可能出错考场,使得只需要抽检不到0.5%的考场,即可基本上找出全部整场出错的考场,从而提高了校对审核的效率。 关键词:相关系数 大规模考试 错误检查 中图分类号:C8 文献标识码:A 作者简介:孟宪武 河南周口市招生办,高级程序员。 1 问题的提出 目前,全国性和地方性的大规模考试非常普遍,如普通高招、中招、自学考试、高中会考,还有许多行业的考试、资格考试等。大部分考试采用主观试卷方式或主观试卷与客观试卷相结合的方式。为了保证评卷和登分过程的客观公正,在对主观试卷评卷和登分的过程中,通常采用对考场号加密的方式进行。即在整个评卷和登分过程中,隐去每场试卷的原始考场号而改用考场密码,待评卷、登分、复核等过程结束后,再根据密码与考场对照表转换成实际考生成绩,所有评卷、登分和复核人员只能见到考场密码而无法知道实际考场号。这样做的好处是从技术上保证了评卷的公正性,但也带来一个非常大的问题:如果在对试卷更换密码的过程中,将两场试卷的密码颠倒或多场密码串位,或在试卷运转过程中密码丢失、出错,必然会导致一个考场甚至多场考生成绩整体出错。由于这些考试的考场数量巨大,整个评卷登分的环节又比较多,因此这种密码出错的情况很难避免。如果这种错误不能及时得到纠正,必将大大增加后续校对审核的工作量。笔者通过对考生考试成绩的分布规律的研究,根据相关性分析原理,在登分结束后,对每个考场成绩分布情况进行相关性分析,并根据相关系数迅速锁定有可能整场出错的考场,大大提高了校对审核的效率。 2 相关性分析的基本原理 2.1 两个序列的相关性 假设有两个序列: X: Y: 根据统计学原理,两序列之间的相关系数 式中 = 、分别是两个序列的平均值,n为两序列的样本个数。 由于相关系数的基本公式不易计算,可从基本公式导出以下的计算式 相关系数r的取值范围为1≥r≥-1,r的各种取值的意义为: r=1,序列X和Y是线性正相关; r=-1,序列X和Y之间是线性负相关; r=0,序列X和Y之间不相关; 1r0,序列X和Y之间正相关,r越大相关度越高; 0r-1,序列X和Y之间负相关,r越接近-1负相关度越高。 2.2 相关系数r与样本个数n之间的关系 将通过n个样本计算出的相关系数记为。理论上讲,只有当样本个数n趋于无穷大时所得到的才能真正表示两个序列的相关程度。当样本个数为有限时,的值会在附近波动,n越大则与的偏离程度越小。由于通过数学公式导出分布的解析式非常复杂,下面,用蒙特卡罗方法来研究的分布规律(为简便起见,只研究两个不相关序列的相关系数分布情况)。 由计算机产生两个相互无关的随机序列(记为一组) X: Y: 由于两序列是无关的,理论上讲其相关系数应为0,实际上,当样本个数n为有限值时,不一定为0,而是一个在0附近的随机数。由计算机产生M组随机序列,即可得到M个,其分布如图1所示(M=50000): 图中,当n=100时,0.1655的概率为90%,0.1964的概率为95%,=0.0101; 当n=50时,0.2362的概率为90%,0.2811的概率为95%,=0.0206; 当n=30时,0.3064的概率为90%,0.3608的概率为95%,=0.0347; 由以上结果可以看出,的分布基本为正态分布,其方差与n成反比,约等于1/n。由此也可以得出这样的结论,当求出两个序列的相关系数不为0时,并不能简单得出两个序列相关的结论;反之,当两个序列的相关系数为0时,也不能得出两序列不相关的结论,两者都只能得出有多大可能性是相关或不相关的结论,n越大结论的确定性也越大。 3 考试成绩的相关性 3.1 单科成绩的相关性 如果在考试中,一科的考试一部分内容使用客观卷(采用涂答题卡方式),另一部分使用主观卷(传统答题方式),则一个考生考试后即得到两个成绩,客观卷成绩和主观卷成绩。一般情况下,若一个考生的成绩较好,则客观卷成绩和主观卷成绩都比较好,反之,则客观卷成绩和主观卷成绩都比较差,即这两个成绩之间存在一定的相关性。考虑到客观卷和主观卷考察的重点不同和一些其它因素的干扰,两个成绩不会是线性相关,但一定是相关度比较高的正相关。理论上讲,两个没有任何联系的考生甲和乙,考生甲的客观卷成绩和考生乙的主观卷成绩之间、考生乙的客观卷成绩和考生甲的主观卷成绩之间不应该存在相关性。当然,这种相关性和不相关性必须是在对一定数量的考生(例如一个考场的考生)成绩进行统计分析中才能够显现出来。 如

文档评论(0)

xiaofei2001129 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档