项目反应理论.docVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

项目反应理论

任何一种理论都不可能是完美无缺的,作为测量初期发展起来的理论更是不可避免地存在着一些缺陷。项目反应理论(ItemResponseTheory,IRT)则是在反对和克服传统测量理论的不足之中发展起来的一种现代测量理论。

无论是CTT还是GT,其测验内容的选择、项目参数的获得和常模的制定,都是通过抽取一定的样本(行为样本或被试样本),因此可以说二者都建立在随机抽样理论基础之上。它们的局限性主要表现在以下几个方面:

(1)信度估计的精确性不高

测量的重要目标就是降低测量误差,提高测量的精度。在经典测量理论中,信度被定义为真分数的方差与实得分数(原始分数)的方差之比。然而,在此定义中,真分数的方差和误差的方差都无法求取。为了估计信度,CTT又提出了平行测验的概念,并在此基础上推演出了若干个信度估计公式。但是严格的平行测验是不存在的,等价测验也很难获得的,在此基础上估计的测验信度很难达到比较高的精确程度。另外,经典测量理论中的信度估计值也是一个笼统值,即假定对不同能力水平的被试来说,测量的误差是相同的。而事实是,一份测验只有在施测于能力水平与测验难度相当的被试时容易获得比较高的测量精确度。当测验施测于能力水平高于(或低于)测验难度的被试时就容易产生较大的测量误差。而且测量误差值会随着被试水平与测验难度距离的增加而变大。

(2)各种测量参数的估计依赖于被试样本

经典测量理论构造了一个完整的理论体系,同时设计了一套参数指标来刻划测量各方面的特性。如信度、效度、项目的难度、区分度等。但是这些参数的估计对样本的依赖性是很大的。如项目难度,对于同一题目,若样本的群体水平较低,就有较高的难度估计值。测验的信度和效度采用相关分析法,同样受到样本的影响。为避免抽样误差对参数估计的影响,经典测量理论特别强调样本对总体的代表性。但经典理论所用的是随机抽样,随机抽样总有一定偏差存在。何况在实际工作中,由于客观条件的限制,还不能做到随机抽样。因此,参数估计值对样本的依赖性使得所估参数对测验的分析的价值是有限的。

(3)误差指标笼统单一,不精细。

CTT导出测量的标准误差SE,SE是所有被试测量误差的标准差,或称为测验平均标准误差。CTT把此值用来描述所有被试的测量精确度。这种所有被试都使用等测量标准误差是CTT理论的一大不足,因为相同的测验对于不同水平的被试会有不同的测量误差,一个被试的水平与一份测验的难道相当,测量的误差较小,结果较准确。被试水平低于或高于测验难度,测验的误差就会增大。因此,用一个笼统单一的或作为平均的误差指标来反映所有被试的测量精确度是难以令人满意的。因此,必须寻求针对每一个被试的更为精细的测量误差指标。

(4)能力难比较

被试的测验分数依赖于所测项目的难度。不同测验测量同一种心理特质时,会得到不同的测验分数。项目难度高,被试测验分数低。这样,被试在不同测验上所得的分数难以比较。

(5)缺乏预测力

CCT不能提供不同能力水平的被试如何对项目作出反应的信息,而实际工作中却往往要对被试答对各项目的概率进行估计。

项目反应理论(ItemResponseTheory,IRT),又称潜在特质理论。

1、IRT的基本思想

潜在特质,假设被试对于测验的反应是受某种心理特质的支配,首先我们要对这种特质进行界定,然后估计出被试这种特质的分数,并根据该分数的高低来预测和解释被试对于项目或测验的反应。因为这种特质无法直接测量,所以称为潜在特质

2、IRT的基本思路

确定被试的心理特质值和他们对于项目的反应之间的关系,这种关系的数学形式就是“项目反应模型”。IRT的核心就是数学模型的建立以及对模型中各个参数的估计。

3、IRT的基本假设

(1)潜在特质空间的单维性假设

潜在特质空间指对于某一特殊行为的发展起作用的所有潜在特质的集合。大多数项目反应模型都假设完全潜在空间是单维的。

(2)局部独立性假设

被试对一个测验项目的反应不受他们对其他测验项目反应情况的影响。

(3)项目特征曲线假设(ICC)

反映了被试对某一测验项目的正确反应概率与该项目所对应的能力或特质水平之间的函数关系。

4、项目反应理论的重要特点

(1)项目的难易度的估计不因样本不同而不同。

(2)被试能力的估计不因测验的改变而改变。

(3)测量误差的估计对每一位被试单独给出。

(4)要为项目参数建立一个指标体系

(5)要为被试的能力建立一个指标体系

5、优点与局限性

(1)能力参数估计的不变性,即个体独立于测验。

(2)项目参数估计的跨群体不变性。

CTT中各种项目参数严重依赖与被试样本。在IRT中测验项目参数的估计具有跨群体不变性,即测验项目参数的估计独立于被试样本,与所使用的被试样本无关。

(3)提供

文档评论(0)

duantoufa005 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档