- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[工厂管理KPI指标[工厂管理KPI指标[工厂管理KPI指标
教育测量与评价的质量特性
——信度和效度
教育测量与评价的质量特性
教育测量与评价的信度
教育测量与评价的效度
教育测量与评价中题目的难度
教育测量与评价中题目的区分度
教育测量与评价方案的可用性
“四度”
方案的可用性
一、信度的意义
信度是指测量结果的稳定性程度,记为rXX 。换一句话说,信度是指用同一测量工具反复测量同一种物质对象所得多次测量结果间的一致性程度。
测验信度是对测验工具及其操作的整体质量的一种量度,是测验性能的重要质量指标。如果测验本身抗干扰能力强,测验实施过程各方面误差因素都控制得好,多次施测所得分数(测值)的一致性就高,那么测量信度高,人们在使用所得测值时就会感觉可靠。
二、信度的统计定义
X = T + E
X:观察分数(测量的结果)
T:真分数(客观具体的实际水平)
E:测量的误差
σ2x = σ2T + σ2E
σ2x :观察分数的方差
σ2T :真分数的方差
σ2E :误差分数的方差
二、信度的统计定义
定义1:信度是一个被测团体真分数方差与观察分数方差之比。即:rXX=σ2T / σ2X (0rxx1)
定义2:信度是一个被试团体的真分数与观察分数的相关系数的平方。即:rXX=ρ2TX
定义3:信度是一个被试团体在测验X(A卷)上的观察分数与在测验X的任意一个“平行测验” X´(B卷)上观察分数的相关系数。即: rXX= ρXX´
三、信度的估计方法
重测信度
复本信度
同质性信度
重测信度
重测信度是指用一个量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。
重测信度有个基本假设,那就是假设某测验所要测量的潜在特质,短期内不会随时间推移而改变。
重测信度
重测信度属于异质性测验
异质性测验:一个测验包括几个不同的部分,这几部分分别测量几个不同的心理特质,它们之间可能并不存在相关或相关较低。(如加减乘除)
重测信度适用于速度测验而不适用于难度测验
速度测验由于题量较大,有规定的时间,第二次测验较少受记忆的影响。
重测信度还适用于运动技能的测验
复本信度
复本信度是指两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。
复本测验:在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验。
复本信度
实施复本测验的方式:一是在同一个时间连续施测(此时所得的复本信度叫等值性系数),二是间隔一段时间后施测(此时所得复本信度叫等值稳定性系数)。
使用复本信度首先要构造出两份或两份以上的真正的平行测验。这是一个很难达到的条件。另外,重测信度的一些不足,在复本信度中仍然存在,需要加以克服。
复本信度不仅适用于难度测验,也是适用于速度测验。
同质性信度
同质性信度的概念
同质性信度(内部一致性信度)是指测验内部所有题目间的一致性程度。这里题目间的一致性含有两层意思:其一是指所有题目测的是同一种心理特质;其二是所有题目得分之间都具有较高的正相关。
同质性信度
同质性信度的概念
同质性信度的基本假设:当一个测验具有较高的同质性信度时,说明测验主要测的是某一单个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映。
同质性信度不适用于异质测验和速度测验。
估计同质性信度的三种方法
估计同质性信度的三种方法
分半信度
库德-理查逊信度
克龙巴赫系数
估计同质性信度的三种方法
分半信度
分半信度指是的将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
分半信度的计算方法和等值复本信度的方法类似,只不过分半信度计算的是两个“半测验”上得分的相关系数,只是半个测验的信度,还必须用斯皮尔曼—布朗公式加以校正。
估计同质性信度的三种方法
分半信度
计算分半信度的方法并不难,南难就难在如何将测验分成相等的两半。分半分方法很多,如按题号的奇偶分半、按题目的难度分半、按题目的内容分半等等。
在实际的应用中,由于题目一般都是依据难度大小排列,采用奇偶分半可使两半测验的题目在难度上基本相等,因此常常被采用。
估计同质性信度的三种方法
库德——理查逊信度
该方法适合于测验题目全部为二分记分题的测验的内部一致性信度分析。常用的库德-理查逊公式有:
估计同质性信度的三种方法
克龙巴赫系数
当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫系数。其计算公式为:
标准测验的信度分析
标准参照测验的概念
标准参照测验是以预定的标准为参考,来衡量个体被试是否达到标准的一种测验。所谓标准就是有测样所参考的行为领域和或教学目标所确定的被试在测验上应当达到的行为表现。
标准测验的信度分析
标准测验信度分析的两种方法
文档评论(0)