- 3
- 0
- 约3.15千字
- 约 5页
- 2017-07-02 发布于福建
- 举报
应用于考试中IRT 参数估计简化程序设计
应用于考试中的IRT参数估计简化程序设计 朱宁宁 ? 目前,越来越多的考试都应用项目反应理论Item Response Theory,称简IRT)作为题目分析、题库建设以及分数估计等方面的主要方法。 但是,这一方法因为具有太多的数理统计内涵,以至不容易被人掌握。而且,目前用于IRT参数估计的软件虽然不少,比如有BIGSTEPS、PARSCALE、BILOG以及MULTILOG等Embretson & Reise,2000),但是作为商业软件,这些工具都有特定的应用范围和条件,并且功能过于复杂,设计的目的主要是供研究者使用的,并不容易为一般应用者所掌握。这些问题的存在,导致了我国考试界对IRT技术了解不深和应用不广。 实际上,对于计划要在考试中使用IRT技术的广大考试管理者和实施者而言,他们更希望有一个易于使用,并能满足一般数据处理要求的IRT参数估计程序,以便能将现在的考试系统提升到一个新的更有效的水平上,并能适应现代计算机技术不断进步的要求。 本研究使用边缘极大似然估计MMLE)的方法进行项目参数的估计,并用贝叶斯法Bayes)期望后验估计EAP)的方法进行结果分数参数估计Baker,1992),设计出一个功能简化的用于二级计分的2PL模型的参数估计程序,简称MyPro。这一程序的特点是:使用简便,嵌入性较强。 1模型简介 二级计分的2PL模型项目特征曲线可表示为: Pi(1/2) 其中,Zij=j-i为题目区分读,λi为题目的难度。 2. MyPro与Bilog在估计结果上的对比 BILOG(Mislevy & Bock,1990)是用于二级计分的项目反应理论模型参数估计的流行工具,这个程序已经有适用于Windows平台的版本,可完全通过菜单设置参数,来完成1PL、2PL和3PL的IRT模型的参数估计。在本研究中,使用的对比程序就是BILOG(3.11版)。BILOG-3程序使用流行的(MMLE)方法来进行项目参数的估计,默认用(EAP)方法进行特质参数的估计。 下面,用蒙特卡洛(Monte Carlo)模拟方法,将MyPro与Bilog-3加以对比,以观察其可用性。首先模拟10次考试数据:每次考试有3000个考生参加,试卷的题量为50题。其中,题目鉴别度A采用Log正态分布加以模拟,题目难度B采用正态分布模拟。能力值Theta也使用正态分布模拟。受测者的应答情况采用2PL模型加以模拟(由于模型本身即要求数据的一维性,因此模拟的数据已经符合模型的要求,不必再进行模型符合性的相关检验)。 得到10组受测者应答矩阵以后,分别使用MyPro和Bilog-3进行参数的估计。MyPro和Bilog-3方法得到A值、B值和THETA值的各10组数据,将这些数据分别和初始模拟的A值、B值和THETA值进行比较,分别计算出每一组的误差的标准差的平均值,以之作为估计误差。结果如表1所示:
从表1中可以发现: (1)将MyPro和Bilog-3的估计结果与模拟的初值进行误差分析,发现两个程序的估计的准确性水平较为一致。可认为这两种程序的估计具有同样的准确性。 (2)通过对比MyPro和Bilog-3两种程序的估计结果,发现两个程序的估计结果的差异较小。可认为两种程序的估计结果之间具有一致性。 从模拟研究结果观察,MyPro这个参数估计程序,虽然距离Bilog的复杂性还有很大的差距,但是已经达到了可用的标准。 需要使用者注意的是:和Bilog等程序一样,MyPro简化程序没有包含IRT模型假设检验过程,因此需要用户预先保证输入MyPro的数据是符合IRT的模型假设的(可通过DIMTEST或DETECT等程序考察数据的特征)。 3MyPro的用法介绍 MyPro这个程序包含两个功能:MyPro. MMLE和MyPro. EAP,分别用于估计项目参数估计和能力参数。用户可选择需要的功能,分别进行调用。 MyPro. MMLE包含三个参数: vData,1MNC和dJD。最简单的情况下,用户只需要输入vData这个参数,这是考生在每个题目上的得分数据,按照以下形式排列(n名考生,m个题目):
其中,1MNC用于设定最大的迭代次数(默认为100),dJD用于估计精度(默认为0. 001),这两个参数都是可选的。估计结束以后,会生成一个结果文件:EM. LOG。包含A与B参数的估计值,及其卡方检验结果。使用者可直接调用项目参数估计的这些结果。下面举例说明如何用一个Windows的脚本运行这一程序:
set MyPro=Server. CreateObject(IRT. MyPro)MyPro. MMLE vData
MyPro. EAP也包含三个参
您可能关注的文档
- 天津市近地层PM2, 5 垂直分布特征[J].doc
- 天津污灌区土壤重金属污染环境质量和环境效应.doc
- 天然次生林人工更新后对土壤物理性质及碳贮量影响.doc
- 天荒坪抽水蓄能电站电气设计若干问题.doc
- 天铁炼钢厂2# 转炉大修工程中吊装新工艺实践.doc
- 太湖北部夏季浮游藻类多样性和水质评价.doc
- 太湖梅梁湾沉积物和湖水对四角菱生长影响.doc
- 太阳能-热泵联合干燥木材实验研究.doc
- 太阳能光伏-燃料电池联合发电系统蓄电池和燃料电池配置研究.doc
- 奥林匹克运动人文精神及其在中国实践.doc
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
最近下载
- 交流转辙机道岔动作电流故障曲线分析信号集中监测课件.pptx VIP
- 2025届东北三省三校高三下学期第一次联合模拟考试政治试题(原卷版+解析版).docx VIP
- 养老服务质量检测90项.pdf VIP
- 光谱分析图谱与标志.docx
- 2025新课标中考英语词汇.pdf VIP
- T_CNPHARS 0001-2025 群体药动学药效学分析标准操作规范.pdf VIP
- (2026年)血浆置换及血浆分离吸附护理要点PPT课件.pptx VIP
- 农村狗狗交配的全过程,让你看了有点不可置信.pdf VIP
- 医院培训课件:《死亡医学证明(推断)书》规范填写及死因链基础知识.pptx VIP
- 健康体检表样表最新文档.docx VIP
原创力文档

文档评论(0)