测验同质信度的分析-考试研究.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
测验同质信度的分析-考试研究.doc

测验同质信度的分析 顾海根 (作者简介:顾海根,教授,博士生导师,上海师范大学教科学院应用心理系,上海,200234。 摘要:本文讨论了测验同质信度概念、不同指标、适用条件以及估计方法,特别对近年来发展起来的同质信度指标β系数、γ系数、ζ系数、ρ系数进行分析,并与传统的克朗巴赫系数进行了比较,得出了系数不是一个理想的同质信度指标的结论。 关键词: 同质信度; α系数; β系数; γ系数; ζ系数; ρ系数 同质信度又叫内在一致性系数,是估计测验内部一致性的指标。这里讲 虽然同质信度原定义为测验内部的一致性程度,但是这个概念也可以应 一、同质信度常用的指标 同质信度有多种指标,最常用的有分半信度、库德理查逊公式系数(KR一20公式系数)和克朗巴赫系数。 (一)分半信度 按照信度系数的定义,必须要拿两个彼此平行的测验对同一组被试施 分半信度走出了使用单一形式测验只施测一次求出信度系数的路子,关 那么如何把测验分成对等的两半呢?对等的两部分测验起码有两个要 1.奇、偶数题目必须成对; 2.成对值的数目一般要大于30; 3.两列数据都应呈正态分布。因此,该方法通常用于由选择题组成的考试。 采用分半法需要注意一点:在人格测验中,测题往往包含不同的特质,比如艾森克的人格问卷,它把测题(P)、内(E)、神经质(N)、说谎(L),而且各特质的测题都是分散分布,那么这时 (二)克朗巴赫系数和库德理查逊公式 1.克朗巴赫(Cronbach)系数 上述单一形式测验信度系数求法并不能广泛推行,因为它要求测验中所?既然我们在实际上编制出X,思想上设所以上式可以写成 这样上式分子就有项,每项结构相同,都是两个标准差的积再乘以上式分子中是两个平行测验项目的交叉协方差的平均数,但是这两个平这样上式就可以用单一形式测验一次施测所得资料实际求出了。于是,了。这是一个适用面很 由于一个测验项目间的平均协方差,可以用所有项目协方差的和跟协方 差个数的比来代替,于是上式可以写成 又因为测验总分方差等于测验项目上分数方差加上所有项目协方差的 因此,单一形式测验信度系数为 (1) 这就是著名的克朗巴赫系数(可以证明系数是信度系数的低限估)[1]。 2.库德理查逊公式法 假如一个测验全是二值记分的项目所组成,那么上式中每个项目上的分p与未通过率二者的积。 (2) 这就是KR20公式。它是系数,是信度系数的低限估计值。 从分半相关,到系数KR20公式,这一大类单一形式测验信度系数, 3.对信度系数的质疑 克朗巴赫系数只是给出了测验信度估计的下界,但是一致性信度和 通过克朗巴赫系数的推导过程我们可以知道 若上面的不等式取等号,则系数就是测验信度的精确估计。不等式取(1)分测验,2,,…,是平行测验,即测验,2,,…,的真分数,2,,…,两两之间的相关为l,且具有相等的真分数(充分但非必要条件)。(2),2,,…,是基本等价,,2,,…,的真分数,2,,…,两两之间的相关为1,且(充分必要条件)。 因此,如果测验中的各个项目不满足基本等价测验的条作 在心理与教育测验中,仅系数常用来描述一个测验同质性的高低,为了说明系数在描述测验同质性时的局限性,下面首先考虑同质性测验与系数之间的关系。 由协方差理论的相关研究可知,用系数作为测验同质性的指标并不是十分可靠,同质性测验的信度不仅仅与题目间的相关程度有关,而且与不同项目在共同因子上的因素载荷有关。在心理与教育测验中,在保证测验同质的前提下,系数高表明测验同质性高,系数低并不一定说明测验同质性低;但是反过来,测验系数的高低并不能对一个是否同质作出判断。 相等的真分数方差和相等的误差方和等价测验要求几个测验具有相等 的真分数方差,但可以有不同的误差方差,即在同质性测量模型中限制,可见,同质性测验对应的协方差结构模型(若称为模型1)要比等价测验对应的协方差结构模型(若称为模型2)的限定条件少得多;而 平行、狈0验对应的协方差结构模型(若称为模型3)则要求更多的限定条件。三个模型间的关系:模型3嵌套于模型2,模型2嵌套于模型1。对这样的嵌套模型,很容数作为同质性测验信度精确估计的条件太严格了,用系数的大小作为同质性测验信度的估计是不可靠的。 另一方面,的数值直接受项目多少的影响。 在考虑测验的构想效度时,往往考查测验的同质性,即一个测验里的分测验或题目群是否测量单一概念。单一维度内的题目具有一致性,这种一致性主要受两方面变异的影响,一是内容的同质性,二是所研究的行为的同质性。所要测量的

文档评论(0)

wendang_12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档