第5讲:测验的信度问题定稿.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5讲:测验的信度问题定稿

由于测量误差的存在,被试在测验中的得分有可能高于真分数,也有可能低于真分数。为了解释被试所得分数的真正含义,我们需要利用测量的标准误来估计出被试真分数的范围。 根据区间估计的方法,假定一个测验的标准误是SEM=10,被试得分X=50,如果我们想使推测的正确率达到95%,被试的真分数就落在观测分上下1.96个标准误的范围内, 即 (X-1.96SEM)≤T≤(X+1.96SEM),结果是30≤T≤70。这表明,被试的真分数落在30到70分之间的可能性有95% 。 如果这里有一个分数线,我们会看出,分数线和置信区间是有矛盾的。假如分数线是60分,一被试得分50,取95% 置信水平,我们很难说该被试的真分数是在分数线的哪一边。 由于测量误差的存在,我们在做决策(比如制定分数线)时就要格外小心。当然,标准误越小,我们在根据测验分数做决策时犯错误的可能性就越小。 正态分布下的标准误差 思考题: 1 真分数理论的基本内容是什么? 2 估计信度的方法有哪三大类? 3 内部一致性信度的估计方法有哪些? 4 怎样估计主观性测验的信度? 5 影响信度的因素有哪些? 6 标准误在解释测验分数时有什么作用? 第五讲:测验的信度 5.1 经典真分数理论 5.2 估计信度的方法 5.3 影响信度的因素 5.4 信度系数的用途 前言 信度即可靠性,是指测量结果的一致性程度。 分数受到测量误差的影响。测量误差有两类,一类是随机误差,另一类是系统误差。随机误差对测验分数的影响的方向是不定的 ,系统误差对分数的影响是稳定的 。随机误差的来源有许多,如猜测、测验环境、评分的错误等。系统误差来源于人的或测验的某些与所测能力无关的因素。 A B C 5.1真分数(true score)模型 5.1.1真分数模型及其基本假设 真分数模型: 对于任何一个观测分数,都可以把它看成是由两部分组成的,一部分是真分数,即被试的真实能力,另一部分是误差分数,即由随机误差造成的分数。这个模型用公式表示就是: X=T+E;其中 X是观测分数,T代表真分数,E 代表随机误差。 例:有一个10个题的测验,被试有三个,他们答题的具体情况是: X1=7—2=5 X2=4+3=7 X3=8+0=8 基本假设一:误差分数是随机的、非系统的,因此它和真分数之间没有相关,即真分数和误差分数是零相关。 基本假设二:对一组被试来说,误差分数的平均分等于零。因为误差的作用有正有反。 基本假设三:两次测量的误差分数之间的相关为零。因为误差是随机出现的,因而两次测量所产生的误差应当是相互独立的,它们之间没有必然联系。 根据三个基本假设,可以推出观测方差中包含了真分数方差和误差的方差: 5.1.2 信度系数 信度概念说的是测验分数中有多少是稳定的,也就是说真分数在总分中所占的比例有多大。相应的,也就是真分数方差在总分方差中所占的比例有多大,因此,我们用r来代表这个比例,即: 5.1.3 平行测验概念的引进 假定有两个测验,所测的是同一种能力,同一组被试在这两个测验上具有相同的真分数,而且,两测验的误差的方差也相同,这样的两个测验是平行测验。 由于随机误差的存在,平行测验的观测分之间不可能完全相关,其相关程度取决于误差的大小。 根据平行测验的概念和真分数理论的三个基本假设,平行测验观测分之间的相关,等于其中任一测验真分数方差与总方差的比值,即: 5.2 估计信度的方法 在真分数模型里,估计信度的方法分为三类,每一类所侧重的误差来源不同。对内部一致性程度的估计,侧重测验自身和评分程序的误差;对稳定性的估计侧重不同时间得出的分数间的一致性;对等价性的估计侧重同一测验的不同形式是否对等。 5.2.1再测信度 概念:同一测验让同一组被试做两次,两次测验中间隔一段时间。计算两次测验分数之间的相关,其相关系数表明该测验随着时间的推移是否保持稳定。 使用再测信度时要注意练习效应和学习效应,注意选择合适的时间间隔。 5.2.2复本信度 复本测验是指在性质、内容、题型、难度等方面都一致的两份或多份测验。同一组被试在复本测验上所得结果的相关系数就是复本信度。 5.2.3 内部一致性信度 内部一致性是指同一测验里的各题目或各部分题目是否测了同一个东西。如果测验的各个题目测的都是同一个东西,这些题目间就有一致性,反之,题目之间则没有一致性。 估计内部一致性信度的方法有很多种,这些方法大致可以归为两类。一类是通过测验两半的相关来估计,另一类是通过题目的方差来估计。 0/1计分测验的内部一致性信度 分半信度:

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档