网站大量收购独家精品文档,联系QQ:2885784924

心理测量第4章心理与教育测量的信度.pptxVIP

心理测量第4章心理与教育测量的信度.pptx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

心理与教育测量的信度第四章

作为一个好的测验,它的结果必须可靠。所谓可靠,是指多次测量的结果保持一致。人们通常把测量结果的可靠性称为信度,即测量结果的一致性或可信性程度。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变。

在测量学中,信度被定义为:一组测量分数的真变异数与总变异数(实得变异数)的比率,即:01式中的02称作信度系数03

信度是指测量工具所获得的结果的可靠性。每个信度的估计值仅指某一特定类型的一致性,而非泛指一般的一致性。信度的估计是完全采用统计方法的。010203注意:

信度的作用信度是测量过程中随机误差大小的反应信度可以用来解释个体测验分数的意义信度可以帮助不同测验分数之间进行比较一个测验有多个信度估计值,因而误差估计值也有多个,我们在实际工作中要注意选择最适合某一特殊情况的信度估计来解决问题。测验分数不能看成是一个点,而应该是一个范围。

评价测验信度系数是衡量测验好坏的一个重要指标,最理想的r=1.00,但这是办不到的。不过我们可以用已有的同类测验作为比较的基准。一般能力测验和成就测验的信度系数都在0.9以上,有的可达到0.95;而性格、兴趣、态度等人格测验的信度一般在之间或更高些。

一般原则是:当rxx<0.70时,测验不能对于个人作出评价或预测,而且不能做团体比较;当0.70≤rxx<0.85时,可用于团体比较;当rxx≥0.85时,才能用来鉴别或预测个人成绩或行为。另一原则是,新编的测验信度应高于原有的同类测验或相似测验。0102

测验类型信度低中高成套成就测验0.660.920.98学术能力测验0.560.900.97成套倾向性测验0.460.880.96客观人格测验0.460.850.97兴趣测验0.420.840.93态度测验0.470.790.98

个人测验分数的误差信度系数仅表明一组测量的实际值与真值的符合程度,并没有给出个人测验分数的变异情况。由于误差存在,一个人所得的分数一般很难等于真分数。理论上我们可以对一个人施测无数次,然后求出所得分数的平均数和标准差,在这里平均数就是这个人的真分数,标准差则为测量误差大小的指标,但实际上是行不通的。解释分数

在实际工作中,我们往往用一组被试两次施测的结果来估计误差的变异数。这时个人在两次测试中分数的差异就是测量误差,据此可以得到一个误差分数的分布,这个分布的标准差就是测量的标准误,它是测量误差大小的指标,其计算的公式为:SE为标准误,Sx为所得分数的标准差,rxx为测验的信度。

根据统计学里讲的区间估计的方法,我们可以得知:个人在每次测量中所得分数X有95%的可能性在真分数加减1.96个标准误的范围内,即

两种测验分数的比较来自不同测验的原始分数是无法直接比较的,只有参照统一团体的平均分数,将它们转换成相同尺度的标准分数(如T分数或Z分数),才能进行比较。为了说明个人在两种测验上的差异,我们可以用差异标准误来检验其差异的显著性,其公式:

SEd为差异的标准误,SE1、SE2为两个测验的分数的标准误,将、代入上式中可得S为相同尺度的标准分数的标准差,rxx、ryy分别为两个测验的信度系数。然后再将标准分数的差异与1.96SE(0.05水平)进行比较,即可得出两个测验的差异是否显著。

例:韦克斯勒对104名14岁半至15岁半的儿童,间隔一个月时间前后测了两次,求得全量表的稳定性系数为0.95,实测分数的标准差为15,则测量的标准误为:

如果某15岁儿童韦氏智力量表获得的IQ为115,那么他的智商的真分数的变动范围就是115±1.96×3.35,也就是说,有95%的把握认为,这个儿童真正的智商水平在108.4至121.6之间。

某被试在韦氏成人智力测验中言语智商为102,操作智商为110,已知两个分数都是以100为平均数、15为标准差的分数,假设言语测验和操作测验的分半信度分别为0.87和0.88,问其操作智商是否显著高于言语智商?

估计信度的方法再测信度复本信度分半信度同质性信度评分者信度标准参照测验的信度估计

重测信度用同一个测验,对同一组被试前后两次施测,两次测验分数所得的相关系数为再测信度。因为它能反映两次测验结果有无变动,也就是测验分数的稳定性程度,故又称稳定性系数。其计算公式为:0102

所测量的特质必须是稳定的;遗忘与练习的效果相同;两次施测期间被试的学习效果没有差别计算再测信度应满足以下几个假设;

两次测验的时间间隔要适测法适用于速度测验和人格测验,而不适用于难度测验应注意提高被试的积极性0203采取此法时应注意以下几个问题:

用再测法估计信度的优点是能提供测验结果是否随时间而变化的资料,可作为预测被试将

文档评论(0)

SYWL2019 + 关注
官方认证
文档贡献者

权威、专业、丰富

认证主体四川尚阅网络信息科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510100MA6716HC2Y

1亿VIP精品文档

相关文档