项目反应理论与实践初步:BILOG应用简介.docVIP

项目反应理论与实践初步:BILOG应用简介.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
项目反应理论与实践初步:BILOG应用简介 曹亦薇 (作者简介:曹亦薇,博士,副教授,深圳大学师范学院教育系,广东深圳,518060。) 摘要:BILOG是应用项目反应理论的计算机程序。本文对应用BILOG处理二值数据的具体步骤和相关的IRT基础知识进行了具体介绍。 关键词:项目反应理论 BILOG 随着计算机技术的发展,项目反应理论(Item Response Theory,IRT)对于专门从事教育测量与心理测量的学者们来说已不是陌生的学问了。特别是LOGITIC、BILOG、MCBILOG及MULTILOG等软件的问世,为普及该理论的应用提供了良好的工具。如何将这些工具浅显地介绍给广大读者,是深入推广应用项目反应理论的重要工作。本文拟在应用BILOG软件处理二值数据方面做一些简介,期望更多读者加入应用项目反应理论的行列,更期望有关专家能够提供宝贵的应用经验。 一、项目反应理论的基本概念 1.项目特征函数(Item Characteristic Function,ICF) 从严格意义上来说,项目反应理论是由一组指数族的数学模型组成。使用者可根据不同的数据特征,选择相应的模型。比如说,测验数据是二值型,即0-1数据时,相应的模型为Bernbaum的Logistic模型,其中,还分为1参数(Rasch模型)、2参数、3参数三种模型;如数据为Likert type即等级数值时,有Samejima的等级模型,部分等级模型以及数值仅表示分类的名义模型。尽管类型众多,这些模型都是从测验的目的出发,相应地把能力(在心理学中称为“潜特性”或“潜特质”,并假设为一维的连续体)作为一个公共的尺度,用数学公式把这个尺度和各项目关系表现出来。若选择3参数logistic模型,当第j个项目变量uj为二值数。据时,即 1 答对第j个项目 uj= 0 答错第j个项目 此时具有能力的人答对第j个项目的概率可表示为Pj(): 其中,是能力变量,aj是第j个项目的区分度,bj是它的难度,cj是猜测参数,D是常数1.7。用曲线将Pj()的变化表示的话,aj恰好是该曲线的斜率,aj越大,曲线变化也越大;bj决定该曲线的位置所在,bj越大,曲线则越靠右方,反之曲线靠左方;cj是该曲线的截距,cj越大则表明被试猜测的程度越高。若cj为0,则(1)式就变成了2参数模型。此时bj表示被试以50%的概率正确地回答该题的能力值为。对Pj()的意义通常有两种解释:(I)具有能力的人能够正确回答第j个项目的概率,相应地答错的概率为Qj()=1- Pj()。(II)由所有具有能力的人组成的总体中,能够正确答对第j题的人数比例。 2.能力尺度 被试的能力尺度是由所选择的项目反应模型所决定的。但是这个尺度的原点和单位是不确定的。为了估计模型中的各项目参数,最常用的是设能力的估计值的平均为0,标准差为1。 必须注意到了对于同一测验若使用不同的被试团体来估计各个项目参数时,得到的同一项目的参数是两个不同尺度上的值,因此比较其大小是无意义的。需要通过等值化过程(能力的等值或参数的等值)才能变成同一尺度上的数值。 3.局部独立性的假设 这是项目反应理论中重要的假设。具体意思是:如果将能力值固定时,答对某项目的概率不影响答对其他项目的概率。如果没有这个假定,在参数估计中无法运作。但是实际上这个前提又很难验证。比如说,表示的能力是二维的话,即使固定某一维,由于各人的能力有差异,另一维也会相应地影响到对各项目的反应。因此为了确认局部独立性,通常是利用它的等价命题:确认测验所测的能力是一维的。 4.信息函数 信息函数是IRT中评价测量精度的重要指标。运用这个指标,便可以在能力各个水平上评价其测量精度。而这个信息函数的倒数正好近似地等于能力的估计值的方差: 例如3参数logistic模型的测验信息函数为 其中Pj()=cj+(1-cj)P*j()。 从公式(3)中还可看出测验信息函数正好是项目信息函数之和(可加性)。应用信息函数除了能够评价每个能力水平上的估计精度之外,还可以用它根据估计的精度,灵活地编制适应各能力水平的测验卷,建立试题库。 二、项目反应理论的实际应用步骤 BILOG(Item analysis and test scoring with Binary Logistic Models)由美国著名心理计量学家J.Mislevy和R.D.Bock为应用项目反应理论而编制的计算机程序。在这个程式以前还有LOGIST、BIMIN等程序,在20世纪90年代之后,基本上这个程序成为应用Logistic Models的权威程序。 在BILOG的自我介绍中指出这个程序系统以处理Binary数据(即数据二值型,如0表示错,l表示对的形式)为前提,使用MML和Bayes估计方法为其特

文档评论(0)

153****9595 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档