- 1、本文档共100页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 测验的信度与效度
第四章 测验的信度与效度 任滨海 提纲 信度概述 信度的类型 影响信度的因素 效度概述 效度的类型 影响效度的因素 第一节 信 度 一、信度定义 1、通俗的定义 信度是指同一被试者在不同时间内用同一测验重复测量,所得结果的一致程度。即测量的可靠性或一致性,多次测量结果保持一致。 2、测量学定义: 信度为一组测量分数的真分数方差和总方差(实得分数的方差)的比率。 信度乃是一个被试群体的真分数与实得分数的相关系数的平方。 信度乃是一个测验X与它的任意一个平行测验Y的相关系数。 信度只受随机误差影响,系统误差不影响信度 二、信度的三种指标 信度以信度系数为指标,常用相关系数表示,表示实得分数的变异数中有多少比例是由真分数的变异决定的,例如 rxx=0.9意指实得分数的变异90%来自真分数。 1、信度指数 信度指数的平方就是信度系数 2、信度系数 真分数与实得分数的一致程度 3、测量标准误 测验分数的变异量,信度越高,标准误越小;信度越低,标准误越大。 信度指数(rxT)与信度系数(rXX) 信度定理: 定理 1:如果满足独立性条件(即误差分数与真分数无关)时,真分数方差与观察分数方差之 比(信度系数)等于真分数与观察分数之间的相关系数的平方。 定理 2:如果满足平行测验条件 时,真分数方差与观察分数方差之比(信度系数)等于两个平行测验的观察分数之 间的相关系数 。 三、信度的评估方式 (一)重测信度 (二)复本信度 (三)内在一致性信度 (四)评分者信度 (一)重测信度 1、定义:用同一个测验对同一组被试在不同时间施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。又称稳定性信度、再测信度、施测—再施测信度、跨时间一致性。 10名学生幸福感调查的两次施测分数 重测信度的计算举例 2、注意事项: 所测量的心理特性必须是稳定的。 遗忘和练习的效果基本上是相互抵消的。 在两次施测的间隔时期内,被试在所要测验的心理特质方面没有获得的更多的学习和训练。 易受练习和记忆的影响,两次测试的时间间隔要适当,一般是2~4周较宜,间隔时间最好不超过6个月。 (二)复本信度 1、定义:又称等值性系数,是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。 2、方法:为排除施测顺序的影响,在实施时,可将被试先分为两组,一组人先作A型测验,再作B型测验;另一组人则反之。 10名学生创造力的复本测验结果 复本信度的计算举例 3、注意事项 要构造真正的平行测验 复本测验必须在题目的内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式、测验其它方面都相同或相似。 被试有条件接受两个测验。 (三)内部一致性信度 1、定义: 反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。 2、方法: (1)分半信度: 通常是先把一份测验按题目的奇偶顺序或其它方法分成两个尽可能平行的半份测验,然后计算两半之间的相关,即得到分半信度系数。 两半变异数相等: 积差相关 斯皮尔曼-布朗公式校正 变异数不相等: 弗朗那根(Flanagan)公式: 卢伦(Rulon)公式: (2)同质性信度: 测验内部所有题目间的一致性。用每个题目和其它题目平均数的相关。当各测题得分有较高的正相关时,即为同质;相反,测题间相关很低或为负相关则为异质。 0、1计分项目(库德(Kuder) -理查逊(Richardson)方法) 非0、1计分项目(α系数或克伦巴赫(Cronbach)公式 ) 注意事项 在一个测量多种特质的问卷中,不同的因子的同质性信度应该分开计算。 克伦巴赫α系数相当于计算了所有项目间的一致性程度,避免了分半信度由于分半方式不同所造成的分半系数不一致的问题。 (四)评分者信度 1、定义:用于测量不同评分者之间所产生的误差。是由多个评分者给一组测验结果评分,所得各个分数之间的一致性。 对于客观性试题,评分所引起的误差或忽略不计 对于主观性题目来说,不同评分人员对相同被试的评分存在差异。如心理测量中的投射测验,学业测验中的高考作文,职业选拔中的面试等。 一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。 2、计算 当评分者为2人时,可以积差相关或等级相关 当评分者多于2人时,可以使用肯德尔和谐系数 如有A、B、C三位专家给6位应聘者的面试评分,结果如下,试求评分者信度。 四、信度对测验分数的意义 1、解释真实分数与实得分数的相关 信度系数可以解释为测验的总变异中,真分数造成的变异占百分之几。如,当rxx=0.90时,我们可以说实得分数中有90%的变异是真分数造成
文档评论(0)