特殊儿童教育评估-第三章 心理计量评估基本知识.pptx

特殊儿童教育评估-第三章 心理计量评估基本知识.pptx

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
特殊儿童教育评估-第三章 心理计量评估基本知识

第三章 心理计量评估的基本知识;第一节 信度与效度;;(二)检验方法 1.稳定性系数:又称再测信度。 使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。其大小等于同一组被试在两次测验上所得分数的积差相关系数。 一般是两周到四周较宜,间隔时间最好不超过六个月。 ;;2.复本信度(Alternate-form reliability) 含义与计算 是指两个平行测验测量同一批被试所得结果的一致程度,其大小等于同一组被试在两个复本测验上所得分数的积差相关系数。计算公式同重测信度。;两个复本测验实施的时间不同,复本信度所表达的含义略有不同。 (1)等值性系数 如果两个复本测验是同时连续测试的,则称这种复本信度为等值性系数。等值性系数的大小主要反映着两个复本测验的题目差别带来的变异情况。;(2)稳定性与等值性系数 如果两个复本测验是相距一段时间分两次测试,则称这种复本信度为稳定性与等值性系数。此时两个题目间的差别、两次施测情境、被试特质水平等方面的差别都会成为测验结果不一致的原因。 ;复本信度使用的条件 (1)两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似。 (2)两次测验的时间间隔要适当。 局限: (1)复本法只能减少而不能排除练习和记忆效应。 (2)对于许多测验来说要建立复本是非常困难的。;3.分半信度(Split-half reliability) 含义与计算 是指将一个测验分成对等的两半后,所有被试在这两半上得分的一致性。 分半信度信度与等值性系数的解释一样,即可以把对等的两半测验看成是最短时距内施测的两个平行测验。分半信度描述的是两半题目间的一致性,所以也叫内部一致性系数。;注意题目分半的方法:按题号奇偶性分半、按题目难度分半、按题目内容分半等。 计算方法与复本信度类似,但被试在两半测验上得分的相关系数只是半个测验的信度,所以必须用斯皮尔曼—布朗公式加以校正: ;使用的前提条件和范围 分半信度通常是在只能施测一次或没有复本的情况下使用。其中使用斯皮尔曼—布朗公式时要求全体被试在两半测验分数的变异数相等。当测验无法分成对等的两半时,无法使用。;4.同质性信度(Homogeneity reliability) 含义 同质性信度也叫内部一致性系数,它是测验内部所有题目间的一致性程度。这里的一致性有两种含义:一是所有题目都测的是同一种心理特质,二是所有题目得分之间都具有较高的正相关。同质性信度就是一个测验所测内容或特质的相同程度。;5. 评分者信度(Scorer reliability) 含义与计算 评分者信度指的是多个评分者给同一批人的答卷进行评分的一致性程度。对于主观试题,不同的评分者给出的分数是不等的,这样会造成误差,如何降低评分者信度是心理测量的重要任务之一。;二、效度(validity);效度的数学定义;;总而言之,信度和效度相互排斥又相互依存;没有信度就不可能有效度;没有效度,信度就毫无意义;高信度可能带来低效度;高效度也可能带来低信度。;三、效度的种类;1.内容效度(content validity) 内容效度的含义 测验项目对所要测量的内容范围的代表性程度。 估计一个测验的内容效度就是确定该测验在多大程度上代表了所要测量的心理特质。 或者说内容效度就是测验的测题对测验内容范围的代表程度。;(2)验证测验内容效度的一般程序 以教育测验为例---专家判断的方法 内容效度的确定方法主要是逻辑分析的方法。其工作思路是请专家对测验题目与原定内容范围的吻合程度作出判断。步骤如下: 1)明确测验目的及测验内容的范围。 2)编制双向细目表,确定每个题目所测的内容,并与测验编制者所列的双向细目表对照 3)确定每一小格中的测题数量。 4)写出鉴定报告,考察题目对所定义的内容范围的覆盖率、判断题目难度与能力要求之间的差异等。;双向细目表举例;(3)内容效度的应用 内容效度适合于测验所要测量的内容总体能够明确界定的情况: 标准参照测验 知识测验、技能测验等教育测验 工作表现可以界定的职业心理测验 不适合:智力测验,人格测验;;2.效标关联效度(实证效度) (1)含义 衡量测验有效性的一个很重要的方法是看根据测验所作出的预测能否被证实,如果一个测验的预测结果与将来实际发生的事情非常接近,那么这个测验就是一个好测验。 效标关联效度:指测验分数与效度标准(被假设或定义为有效的某种外在标准)之间的相关。又称准则关联效度。即根据测验所作出的预测能否被实际的结果所证实。 效标即效度标准: 指独立于测验结果,反映测验目的的行为参照。 ;(2)效标关联效度的类型;例如,用大学入学考试来预测被试入学后的学习,如果入学考试成绩好的同学,入学后的学校能力强,取得了好的成绩,那么说明大学入

您可能关注的文档

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档