计算机自适应测验中RASCH模型稳健性模拟研究.pdf

下载文档

9
0
约1.62万字
约 6页
2017-05-25 发布于北京
举报
版权申诉
保障服务

计算机自适应测验中RASCH模型稳健性模拟研究.pdf

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

计算机自适应测验中 RASCH 模型稳健性的模拟研究 1 2 邓远平，罗照盛（江西师范大学教育学院，南昌，330027）摘要：计算机自适应测验（Computerized Adaptive Test，以下简称 CAT）是建立在项目反应理论（Item Response Theory）的基础上，按照一定的策略进行选题并根据被试的作答情况不断地调整测题，以准确地估计被试的能力水平。本研究采用模拟数据的方法，在 CAT 中分别采用Rasch 及 Birnbaum 两种模型估计能力，通过比较两者的误差均方根（Root Mean Square Error，简称 RMSE ）、平均差异（Average Deviation，简称 AD）及能力相关，对 Rasch 模型在 CAT 中的稳健性进行了研究。结果发现 RASCH 模型在区分度不等的条件下中仍然能较准确地估计被试的能力水平，具有很强的稳健性。关键词：CAT，Rasch 模型，Birnbaum 模型，稳健性 1 引言 ______ 在项目反应理论（Item Response Theory ）的基础上，出现了一种新型的考试方式计算机化自适应测验(Computer Adaptive Test，以下简称CAT)，它被誉为 “测验领域的新天地”。传统的纸笔测验不分被试水平高低，都作答同样一批题目，导致低难度对高水平被试和高难度对低水平被试而言都是形同虚设，测验效率低下，CAT扬弃了这一缺点，它的施测方式是从题库中选择与被试水平相匹配的题目进行施测，直到测验的终止规则达到为止。它具备的优点有：结果更加准确、测试时间更短、测验安排的时间更方便、测验的安全性更高，题目曝光率更好控制、测验结果的呈现更即时[1] 。CAT具备下列一些特征： (1)有一个由一定量精选而来的测题所组成的题库作为支持； (2)按照一定的策略进行选题并根据被试的作答情况不断地调整测题； (3)按一定的规则终止测验，评分在施测的过程中进行[2] 。 CAT 近几十年来测验研究中引人注目并取得了重大发展，特别是美国教育服务社（ETS ）提出对托福留学外语考试（TOEFIE ）、研究生资格考试（GRE ）、护士资格证书等进行计算机化考试以来，CAT 更是引起了人们的广泛注意，测试技术正面临重大革新的局面，意义将深远重大。 2 CAT 的概述 2.1 测量模型在教育和心理测量中一个主要问题就是如何将被试在所有题目上的反映如何转化为有意义的量化测量，项目反应理论模型是心理测量潜在特质理论的具体化，是人的测验行为与潜在特质之间关系的真实描述和模拟。模型计分的方式有两种，一种是多级计分，另一种 1、 0 计分（正确记为 1，错误记为 0 ），本研究仅介绍 1、0 计分的逻辑谛斯克模型。 2.1.1 Rasch 模型丹麦学者拉希（Rasch ）是最早独立研究项目反应并获得巨大成功的学者，Rasch 模型通常也叫单参逻辑什谛克模型，指的是被试的能力与项目难度两者关系的数学模型，它只有一个项目难度参数而没有区分度参数。拉希认为，用一批项目去测试被试，就是要在一个线性系统上去确定被试的特质水平，除了项目难度之外，应该维持所有项目的相同性质。拉希公式如下： 1 邓远平（1979、12 一），男，江西兴国人，硕士，研究方向为心理统计与测量 Email ：dyp304@126.com。 2 罗照盛（1971、9 一），男，江西南昌人，副教授，硕士生导师。 -1-