- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用于考试中的IRT参数估计简化程序设计 朱宁宁 ? 目前,越来越多的考试都应用项目反应理论Item Response Theory,称简IRT)作为题目分析、题库建设以及分数估计等方面的主要方法。 但是,这一方法因为具有太多的数理统计内涵,以至不容易被人掌握。而且,目前用于IRT参数估计的软件虽然不少,比如有BIGSTEPS、PARSCALE、BILOG以及MULTILOG等Embretson & Reise,2000),但是作为商业软件,这些工具都有特定的应用范围和条件,并且功能过于复杂,设计的目的主要是供研究者使用的,并不容易为一般应用者所掌握。这些问题的存在,导致了我国考试界对IRT技术了解不深和应用不广。 实际上,对于计划要在考试中使用IRT技术的广大考试管理者和实施者而言,他们更希望有一个易于使用,并能满足一般数据处理要求的IRT参数估计程序,以便能将现在的考试系统提升到一个新的更有效的水平上,并能适应现代计算机技术不断进步的要求。 本研究使用边缘极大似然估计MMLE)的方法进行项目参数的估计,并用贝叶斯法Bayes)期望后验估计EAP)的方法进行结果分数参数估计Baker,1992),设计出一个功能简化的用于二级计分的2PL模型的参数估计程序,简称MyPro。这一程序的特点是:使用简便,嵌入性较强。 1模型简介 二级计分的2PL模型项目特征曲线可表示为: Pi(1/2) 其中,Zij=j-i为题目区分读,λi为题目的难度。 2. MyPro与Bilog在估计结果上的对比 BILOG(Mislevy & Bock,1990)是用于二级计分的项目反应理论模型参数估计的流行工具,这个程序已经有适用于Windows平台的版本,可完全通过菜单设置参数,来完成1PL、2PL和3PL的IRT模型的参数估计。在本研究中,使用的对比程序就是BILOG(3.11版)。BILOG-3程序使用流行的(MMLE)方法来进行项目参数的估计,默认用(EAP)方法进行特质参数的估计。 下面,用蒙特卡洛(Monte Carlo)模拟方法,将MyPro与Bilog-3加以对比,以观察其可用性。首先模拟10次考试数据:每次考试有3000个考生参加,试卷的题量为50题。其中,题目鉴别度A采用Log正态分布加以模拟,题目难度B采用正态分布模拟。能力值Theta也使用正态分布模拟。受测者的应答情况采用2PL模型加以模拟(由于模型本身即要求数据的一维性,因此模拟的数据已经符合模型的要求,不必再进行模型符合性的相关检验)。 得到10组受测者应答矩阵以后,分别使用MyPro和Bilog-3进行参数的估计。MyPro和Bilog-3方法得到A值、B值和THETA值的各10组数据,将这些数据分别和初始模拟的A值、B值和THETA值进行比较,分别计算出每一组的误差的标准差的平均值,以之作为估计误差。结果如表1所示:
从表1中可以发现: (1)将MyPro和Bilog-3的估计结果与模拟的初值进行误差分析,发现两个程序的估计的准确性水平较为一致。可认为这两种程序的估计具有同样的准确性。 (2)通过对比MyPro和Bilog-3两种程序的估计结果,发现两个程序的估计结果的差异较小。可认为两种程序的估计结果之间具有一致性。 从模拟研究结果观察,MyPro这个参数估计程序,虽然距离Bilog的复杂性还有很大的差距,但是已经达到了可用的标准。 需要使用者注意的是:和Bilog等程序一样,MyPro简化程序没有包含IRT模型假设检验过程,因此需要用户预先保证输入MyPro的数据是符合IRT的模型假设的(可通过DIMTEST或DETECT等程序考察数据的特征)。 3MyPro的用法介绍 MyPro这个程序包含两个功能:MyPro. MMLE和MyPro. EAP,分别用于估计项目参数估计和能力参数。用户可选择需要的功能,分别进行调用。 MyPro. MMLE包含三个参数: vData,1MNC和dJD。最简单的情况下,用户只需要输入vData这个参数,这是考生在每个题目上的得分数据,按照以下形式排列(n名考生,m个题目):
其中,1MNC用于设定最大的迭代次数(默认为100),dJD用于估计精度(默认为0. 001),这两个参数都是可选的。估计结束以后,会生成一个结果文件:EM. LOG。包含A与B参数的估计值,及其卡方检验结果。使用者可直接调用项目参数估计的这些结果。下面举例说明如何用一个Windows的脚本运行这一程序:
set MyPro=Server. CreateObject(IRT. MyPro)MyPro. MMLE vData
MyPro. EAP也包含三个参
文档评论(0)