計算机自适应测验中测验安全控制方法评述.docVIP

下载本文档

3
0
约2.61万字
约 13页
2017-01-17 发布于重庆
举报
版权申诉

計算机自适应测验中测验安全控制方法评述.doc

1、本文档共13页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

計算机自适应测验中测验安全控制方法评述

本文由iris028贡献 pdf文档可能在WAP端浏览体验不佳。建议您优先选择TXT，或下载源文件到本机查看。心理科学进展 2010, Vol. 18, No. 8, 1339–1348 Advances in Psychological Science 计算机自适应测验中测验安全控制方法评述* 李铭勇 1 张敏强 1 简小珠 1,2 (2 井冈山大学, 吉安 343009) (1 华南师范大学应用心理研究中心, 广州 510631) 摘要计算机自适应测验在实际应用中曾经受到了测验安全问题质疑。国内外学者主要从两种研究思路提出了测验安全控制的方法：一是控制项目的最大曝光率, 沿着这个思路发展出来的方法有 SH 法、项目合格方法、多重最大曝光率法等; 二是改进选题策略, 沿着这个思路发展的方法主要是 a 分层法及其变式。此外, 近年来出现了测验安全控制方法之间相结合的研究思路。本文从均方误差、项目曝光率、题库利用率等指标论述了测验安全控制方法的优缺点, 并概述了这些测验安全控制方法的研究发展历程与发展思路, 展望了今后的研究趋势。关键词分类号测验安全; SH 法; 项目合格方法; 多重最大曝光率法; a 分层法。 B841 说, 项目的信息函数是： 1 CAT 中测验安全控制的研究背景 1.1 CAT 在教育与心理测验实践中的应用计算机自适应测验 (Computerized Adaptive Test, CAT)是现代测量理论与计算机技术相结合的产物。与传统的纸笔测验相比, CAT 具有诸多优点, 例如：它能够根据被试能力水平选择相适应难度的试题, 进行施测; 不同的测验成绩具有可比性; 不需要安排在固定的时间、固定的地点; 能够实时评分等等, 使得国内外学者对 CAT 的理论研究和应用研究越来越多。美国的许多大型考试 , 如 GRE( 研究生入学考试 ) 、 TOFEL 、 CGFNS(护士资格考试)、SAT(学术能力测验)、 GMAT(美国商学院入学考试)、ASVAB(美国军队职业能力倾向测验)等都使用了 CAT 的形式; 国内的一些考试也采用 CAT 形式, 比如全国大学英语四、六级考试(试用阶段)、台湾初中升高中的基础知识测试(简称“基测”)等等。 1.2 CAT 的选题策略及由此产生的项目曝光率问题由于 CAT 根据被试能力水平选择能提供最大信息量的试题, 因此一些测量性能优良的试题往往会被优先选择。对于三参数 Logistic 模型来收稿日期：2010-03-28 * 广东省自然科学基金(9151063101000002)、教育部人文社科基地项目基金(2009JJDXLX006)资助。通讯作者：张敏强, E-mail: zhangmq1117@ 1339 I i (θ ) = (1.7) 2 ai2 (1 ? ci ) [ci + e1.7 ai (θ ?bi ) ][1 + e?1.7 ai (θ ? bi ) ]2 (1) 其中 a 、 b 、 c 分别是区分度参数、难度参数、伪机遇参数。由公式 1 可知, 项目的 a 参数越大、 c 参数越小、 (θ ? bi ) 越小, 则越能够提供更大的信息量。IRT 中定义测量误差为测验信息量的平方根的倒数(漆书青, 戴海琦, 丁树良, 2002), 即： SE (θ ) = 1 ∑ I (θ ) i i (2) 由公式 2 可知, 测验信息量越大, 对特质点 θ? 的估计标准误就越小, 此时 CAT 能得到最大的精确性。因此, CAT 的选题策略往往是最大项目信息量法或其变式。基于最大项目信息量的选题, 必然使高 a 参数、 c 参数的项目选中的几率非常大; 反之, 则低选中几率就低, 甚至为零, 这就导致了题库曝光的程度极不均衡。试题曝光率问题在最早的 CAT 测验 ASVAB-CAT 就进行了探讨, 并使用了试题曝光率控制方法 (Sands, Waters, McBride, 1997)。 1.3 CAT 在实践应用中的试题泄露问题由于 CAT 不像纸笔测验那样, 安排在固定的时间、地点考试, 而是一年中反复举行多次, 所以已经参加过考试的考生就有可能将试题泄露 -1340- 心理科学进展 2010 年给将要参加考试的朋友, 这种考生之间的题目分享行为会导致得到试题的考生分数偏高。而更为严重的是有组织的盗题行为(or