心理测量学误差及其检验1.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
心理测量学误差及其检验1

第三章 测量的误差及检验 第一节 测量的误差及其来源 第二节 测量的信度 第三节 测量的效度 第一节 测量的误差及其来源 ◆ 误差的定义 ◆ 误差的种类 ◆ 误差的来源 2、误差的种类 随机误差与系统误差的比较 3、误差的来源 经典测验理论 信度概念 信度的评估方法 信度系数的应用 影响信度的因素 一、经典测验理论 Classical Test Theory(CTT) 基本假设与真分数 经典测验理论(CTT)假定: 观察分数(X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(E)。 即: X=T+E (1)如果对一个人测量无数次,其误差之和为0,平均误差为0。 (2)?误差与真分数相互独立,相关为0。 (3)一个团体的平均真分数等于该团体中所有被试实得分数的平均值。 (4)对于一个团体来说,实得分数、真分数、和测量误差之间有如下关系: 在一次测验中,一个团体的实测分数的变异数是由与测量目的有关的变异数、稳定但出自无关来源的变异数和偶然但出自无关来源的变异数所决定的。 二、信度的定义 三、 信度评估的方法 (一)重测信度(Test-retest reliability) 第一,所测的心理特性必须是稳定的。 第二,遗忘和练习的效果基本上相互抵消。 第三,所测心理特质在两次施测的间隔时间内没有获得更多的学习和训练。 第四,报告结果时要报告两次测验的间隔及有关经历. (二)复本信度(Alternate-form raliability) 复本等值的条件 第一,前提是有复本测验。 第二,被试有条件接受两个测验(时间和经费等)。 第三,报告结果时要报告两次测验的间隔及有关经历. (三)内部一致性信度 1、分半信度(Split-half raliablity) 校正方法 使用条件 测验只能施测一次或没有复本的情况下使用. 当一个测验无法分成对等的两半时不宜使用. 2、同质信度(Homogeneity raliability) (四)评分者信度(Scorer raliability) 附:确定信度的可接受水平 典型测验的一般标准 典型测验的信度高低水平 各种信度系数相应误差变异的来源 友情提示 实际上,有多少种误差的来源,就有多少种信度估计的方法。一般来说,一个测验哪种误差大,就应该用哪种误差估计。有时一个测验需要几种信度估计。 操作演练 假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的A/B两个复本,所得的等值与稳定性系数为0.70。我们还根据 被试对每个复本的反应计算出分半信度为0.80. 同时,我们将另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。 然后,我们对这这三种方法所产生的误差变异进行分析。 一个假想测验的变异数分析 四、信度系数的应用 五、影响信度的因素 测验长度 样本特征 测验难度 时间间隔 (一)测验长度 含义 测验试题的数量 例2-16:某测验有40题,信度0.65, 若增至120题,信度会是多少? (二)样本特征 特点 样本越异质,分数分布越广,有可能高估信度。 2、样本团体平均能力水平的影响 特点: 团体平均水平太高或太低,分布变窄,可能低估信度. 选择测验时应注意 取样团体的变异性和能力水平 建立信度的团体与欲测团体是否一致 (三)测验难度 一般趋势 测验太难或太易,分数范围缩小,降低信度. 难度与题型 简答题:P=0.5时,X为0~100,信度最高。 学绩测验选择题的理想平均难度(洛德) 五择一:0.70 四择一:0.74 三择一:0.77 是非题:0.85 智力的时间变化 思考 如何提高测量的信度? 适当增加测验的长度; 使测验项目的难度分布接近正态; 努力提高试题的区分度; 选取适当的被试团体; 主试严格执行测验规程; …… 几点说明 1.有多少种误差,就有多少种估计信度的方法. 2.上面介绍的各种计算方法仅适用于常模参照测验. 3.标准参照测验的信度问题必须以概化理论为依据. 4.不同类型的测验,信度的要求是不一样的. 5.用不同方法估计的信度也会有所差异. 理论假设: X=T+E; S2X = S2T +S2E 信度:测量结果的稳定性(一致性)程度. 类型 重测 复本 内部一致性:分半、同质性 评分者 OK! 同质性 题目间的内部一致性 类型 库-理信度 克龙巴赫 ? 系数 各类 题型 二值记分 含义 评分者评分的一致性 方法 2评分者 2个以上者 rXY 肯德尔和谐系数 0.90 0.80-0.85 0.60-0.85 标准化测验 人格测验 非标准化测验 最低标准 测验类型 .

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档