测验的信度.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
测验的信度 主讲:邓稳根 信度的概念 一般定义: 信度:即测验的可靠性,指的是测验所得结果的一致程度。它是衡量测验质量好坏的最基本指标。 经典测量理论的定义 经典测量理论的假设:X=T+E.(X为实得分数,T为真实分数,E为随机误差分数。 可以转换为:S2x=S2T+S2E. 信度定义:信度是一组测验分数的真分数方差与总方差(实得分数方差)的比率,即rxx=S2T/ S2x= 1-S2E/ S2x 真分数方差,误差分数方差和信度之间的关系 信度的求取 r2xT=S2T/ S2x,rxT即为信度的第一种表示信度指数。但这里S2T无法求取。 对同一被试反复施测无数次,或用无数个相等的测验对同一被试反复施测无数次,从而一个被试可以得到无数个分数,这无数个分数的平均值为真实分数T,标准差即为测量的误差方差,它也是信度的第二种表示。这里对一个被试能不能反复施测无数次? 对同一批(多于一个)被试前后施测两次或采用两套相等的测验对同一批被试施测,求取两次测验分数的相关系数即为测验的信度系数,即rxx,这是信度的第三种表示。 思考:信度系数与信度指数的关系是什么? 有了rxx,就可以通过公式rxx= 1-S2E/ S2x计算第二种表示中的SE, SE=Sx(1- rxx)1/2 测量标准误与信度的关系:互为消长,信度高,标准误低;信度低,标准误高 例题: 1、公式rxx =r2xT=S2T/ S2x和公式rxT=ST/ Sx表明信度指数的( )就是信度系数。 (A)一半 (B)平方 (C)倍数 (D)本身 2、( )是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。 (A)信度 (B)效度 (C)难度 (D)区分度 3、信度只受( )的影响。 (A)系统误差 (B)随机误差 (C)恒定效应 (D)概化作用 信度评估的方法 根据反映测验误差的不同来源,可分: 重测信度——考察跨时间的一致性。 复本信度——考察跨内容的等值性。 内部一致性——考察题目的同质性。 评分者信度——考察评分的一致性。 注意: 信度估计方法不只上面几种,实际上有多少误差来源,便有多少估计信度的方法。原则上一个测验哪种误差大,便采用哪种估计方法,有时甚至需要有几种信度系数。 重测信度 定义:又称稳定性系数,即使用同一测验,在同样条件下对同一组被试者前后施测两次,求两次得分间的相关系数。 计算方法:重测法。A1 A2,求r12。 优点:能提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据。 缺点:易受练习和记忆的影响。 两次测量之间最适宜的时距:随测验的目的、性质和被试特点而异,一般是两周到四周为宜,间隔时间最好不超过六个月。 复本信度 等值性系数:A B 定义:是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试在两个测验上得分的相关系数。 施测方法:将被试随机分成两半,一半被试先做A,再做B;另一半先做B,再做A,合并两个A和B的数据求相关。 稳定性与等值性系数。A B 两个复本的施测相隔一段时间。 优点:等值性系数能避免重测信度的记忆和学习效应。 缺点:只能减少不能消除练习效应;无法消除迁移效应;建立复本很难。 内部一致性信度 分半信度:1/2A 1/2A 定义 指在测验实施后,将测验按奇偶性分成两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。 校正 原因:测验长度变短,易低估测验的信度; 公式: rxx=2rhh/(1+rhh),(假设条件是两半分数的方差相等,如不等,采用弗朗那根公式或卢伦公式直接求rxx)。 同质性信度 主要代表测验内部所有题目间的一致性。正相关高,测验为同质的;低正相关或为负相关时,测验为异质。 如果测验由许多分测验组成,则要求分测验内部同质,分测验之间异质。 计算方法: 库德—理查逊公式:K-R20,K-R21(适用条件:两级评分,后者还要求测题难度相同或近似) 克伦巴赫α系数:既可适用于两级评分,也可适用于多级评分(如有多项选择的人格测验、态度量表等)。 评分者信度 适用:用于测量不同评分者之间所产生的误差。 两个评分者之间的信度:有若干份试卷,每份试卷由两人评分,然后根据每份试卷的两个分数求相关。(如果受过训练的评分者,其评分一致性应达0.90以上) 多个评分者之间的信度:如果采用等级评分,可采用W系数计算评分者信度。 应注意的问题 有多少误差来源就有多少信度估计

文档评论(0)

xxj1658888 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档