- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
考试成绩相关性分析的实用性研究
孟宪武
(周口市招生办公室 466000)
摘要:根据对长度为?n?的两个序列之间相关系数分布规律的理论探讨,本文得
出相关系数的分布为正态分布且方差为?1/n?的结论,并用以找出大规模考试中
成绩记录整场出错的考场。通过对考生成绩的相关性分析,根据相关系数即可
迅速锁定可能出错考场,使得只需要抽检不到?0.5%的考场,即可基本上找出全
部整场出错的考场,从而提高了校对审核的效率。
关键词:相关系数?大规模考试?错误检查
中图分类号:C8 文献标识码:A
作者简介:孟宪武?河南周口市招生办,高级程序员。
1?问题的提出
目前,全国性和地方性的大规模考试非常普遍,如普通高招、中招、自学
考试、高中会考,还有许多行业的考试、资格考试等。大部分考试采用主观试
卷方式或主观试卷与客观试卷相结合的方式。为了保证评卷和登分过程的客观
公正,在对主观试卷评卷和登分的过程中,通常采用对考场号加密的方式进行。
即在整个评卷和登分过程中,隐去每场试卷的原始考场号而改用考场密码,待
评卷、登分、复核等过程结束后,再根据密码与考场对照表转换成实际考生成
绩,所有评卷、登分和复核人员只能见到考场密码而无法知道实际考场号。这
样做的好处是从技术上保证了评卷的公正性,但也带来一个非常大的问题:如
果在对试卷更换密码的过程中,将两场试卷的密码颠倒或多场密码串位,或在
试卷运转过程中密码丢失、出错,必然会导致一个考场甚至多场考生成绩整体
出错。由于这些考试的考场数量巨大,整个评卷登分的环节又比较多,因此这
种密码出错的情况很难避免。如果这种错误不能及时得到纠正,必将大大增加
后续校对审核的工作量。笔者通过对考生考试成绩的分布规律的研究,根据相
关性分析原理,在登分结束后,对每个考场成绩分布情况进行相关性分析,并
根据相关系数迅速锁定有可能整场出错的考场,大大提高了校对审核的效率。
2?相关性分析的基本原理
2.1?两个序列的相关性
假设有两个序列:
X:?x1,x2,?,xn
Y:?y1,y2,?,yn
根据统计学原理,两序列之间的相关系数
r??
2σ?xy
2
σ?xσ?y
-100.10.20.30.40.50.60.70.8-0.9-0.8-0.7-0.6-0.5-0.4-0.3-0.2-0.10.9式中
-1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
-0.9
-0.8
-0.7
-0.6
-0.5
-0.4
-0.3
-0.2
-0.1
0.9
2σ?xy?=??
2
(xi-x)(yi-y)
n
?(x?-x)
?(x?-x)
?(y?-y)
σy??
i
n
i
n
2
2
??xi?yi-?? in? i?
??xi?yi-?? in? i
????x2-?? i ?????y2-?? i
?
? ?? ?
?
??
?
由于相关系数的基本公式不易计算,可从基本公式导出以下的计算式
x y
r??
? ( x?)2??? ( y?)2??
n n
相关系数?r?的取值范围为?1≥r≥-1,r?的各种取值的意义为:
r=1,序列?X?和?Y?是线性正相关;
r=-1,序列?X?和?Y?之间是线性负相关;
r=0,序列?X?和?Y?之间不相关;
1r0,序列?X?和?Y?之间正相关,r?越大相关度越高;
0r-1,序列?X?和?Y?之间负相关,r?越接近-1?负相关度越高。
2.2?相关系数?r?与样本个数?n?之间的关系
将通过?n?个样本计算出的相关系数记为?rn?。理论上讲,只有当样本个数?n
趋于无穷大时所得到的?r??才能真正表示两个序列的相关程度。当样本个数为有
限时,?rn?的值会在?r??附近波动,n?越大则?rn?与?r??的偏离程度越小。由于通过数
学公式导出?rn?分布的解析式非常复杂,下面,用蒙特卡罗方法来研究?rn?的分布
规律(为简便起见,只研究两个不相关序列的相关系数分布情况)。
由计算机产生两个相互无关的随机序列(记为一组)
X:?x1,x2,?,xn
Y:?y1,y2,?,yn
由于两序列是无关的,
理论上讲其相关系数?rn?应为
0,实际上,当样本个数?n
为有限值时,?rn?不一定为
0,而是一个在?0?附近的随
18
16
14
12
10
8
6
4
2
0
n=100
n=50
n=30
机数。由计算机产生?M?组
随机序列,即可得到?M?个
图?1?50000?组不相关随机序列的相关系数分布
rn?,其分布如图?1?所示(M=50000):
图中,当?n=100?时,?|?rn?|?0.1655?的概率为?90%,?|?rn?|?0.1964?的概率为
95%,??2?=0.0101;
当?n=50?时,?|?rn?|?0.
原创力文档


文档评论(0)