- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
测量的信度与效度解析.ppt
第三章 测量的信度与效度 第一节 测量的信度 第二节 测量的效度 第一节 信度(reliability) 一、什么是信度 定义:指的是测量结果的稳定性程度(或叫可靠性)。也指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。 1、理论定义:传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E),两个部份构成的,公式为: X=T+E 讨论一组测验分数的特性时,可用方差导标具体分数,公式: (测验实得分数的方差)S x2= (测验真分数的方差)ST2+ (测验误差的方差)SE2 2、操作定义: 定义1:一组测量分数的真分数变异数(方差)与总变异数(总方差、实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。计算公式: rxx=ST2/SX2 定义2:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。即 rxx=ptx2 定义3:信度乃是一个测验X(A卷)与它的任意一个“平行测验”X/(B卷)的相关系数。即rxx=pXX`2 二、信度的指标 (一)信度系数:大部分情况下,信度是信度系数为指标,它是一种相关系数。理论上说就是真分数方差与实得分数的方差的比值,公式是:rxx=ptx2 (二)信度指数:是真分数标准差与实得分数的标准差的比值,公式是: 信度指数的平方就是信度系数 rxx=ST2/SX2 (三)标准误:指出个人测验分数的变异量。信度系数表示一组测量的实得分数与真分数的符合程度,标注误表示个人测验分数的变异量。 用一组被试两次测量结果来代替同一个人反复实测,有了信度的另一个指标: 测量标准误。测量的标准误与信度之间呈反比关系:标准误越小,信度越大;标准误越大,信度越低。 三、信度与测验分数的解释 (一)解释真实分数与实得分数的相关:信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。 (二)比较信度可以接受的水平:一般的能力测验和成就测验的信度系数都在0.90以上;人格测验、兴趣、态度、价值观等测验的信度一般在0.80-0.85。一般原则是:当 0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70≤ 0.85时,可用于团体比较;当 ≥0.85时,才能用来鉴别或预测个人成绩或作为。 (三)解释个人分数的意义:从信度可以解释个人分数的意义,这是测量标准误的应用。它有两个作用:一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。 例题:假设在一个智力测验中 某个被试的IQ为100,这是否反映了他的真实水平?如果再测一次他的分数将改变多少?已知该智力测验的标准差是15,信度系数为0.89,则其IQ的测量标准误和可能范围分别为: SE=15 =5.0 Q=100±1.96x5=100±9.8≈90~110 我们可以说这个被试的真实IQ有95%的可能性落在90与110之间。即若再测一次,他的智商低于90、高于110的可能性不超过5%。 (四)比较不同测验分数的差异:测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。 例题:某被试在韦氏成人智力测验中言语智商为102,操作智商为108。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.97和0.93。问其操作智商是否显著高于言语智商呢? 首先计算出差异分数的标准误: 在统计上,经常要求两个分数的差异程度达到0.05的显著水平,才能承认不是 误差的影响。因此,将差异标准误(4.74)乘以1.96,结果为9.29,这表明个体在韦氏测验两半得分的差异高于大约10分,才能达到0.05显著水平。上述被试的分数差异(108-102=6)是不显著的。 四、信度的类型及估计方法 (一)重测信度(再测信度)(test-retest reliabity) 1、含义与计算: 又称稳定性系数。他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。 例:用同一个算术四则的速度测验,对小学五年级的12个学生先后施测两次。结果如下,试求其信度。 2、使用的前提条件 (1)所测量的心理特性必须是稳定的。 (2)遗忘和练习的效果基本上相互抵消。 (3)在时间间隔中没有学习另外的与测验有关的东西,或者说每人学习其他东西的程度都一样。 3、优缺点: 优点: 它最符合重复测验的涵义,是重复测验最简单最明确的方式 (2)首测和再测只需要一套测验题目,省时、省力 (3)同一套题目无论施测几次,所测的属性是完全相同的。 缺点: (1)同一组被试对同一个测验先后两次作答相互
文档评论(0)