2完整版本.2效度.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第二节效度

在物理测量中,使用某种合适的测量工具测量物体所获得的数量资料(即数值与单位)可以对所要测量物体的属性给出明确的意义。但在教学测量中,用分数描述行为反应的心理属性,它的意义就不那么明确了。例如,学生的某次数学测验成绩是依赖他们掌握语文或物理的知识和能力所得到的,那么这次数学成绩在很大程度上并不能反映所要测量的逻辑思维、运算和空间想象等方面的心理属性。因此,需要考察测验到底测量了哪些心理属性,对这些心理属性能够测量到什么程度,这就是测验的有效性。为了估计测验的有效性,需要建立参照标准。我们常常把反映某种属性的有效客观标准称作效标。它可用一份测验卷来体现,用这份测验卷去测试学生称作效标测量,由此得到的分数称作效标分数。

一个测验的有效性,必须着眼于该测验本身所具有的独特的目的、功能和适用范围。对于某种独特的目的、功能和适用范围是正确、有效的测验,对另一种目的,功能和适用范围可能就是不正确、无效的。不存在对于任何目的、功能和适用范围都有效的测验。此外,由于测验是通过行为样本,对特定的某种属性作间接测量,它只能达到某种程度的正确性,一般用两个测验分数之间的相关系数表示,这种相关程度越高,可称该测验的效度越好。因此,只有程度上的不同而不存在全有或全无的差别,而且测验的有效性是相对的。

一、效度的概念

1.效度的定义

我们知道,个体的测验分数可以表示成真分数与误差分数之和。根据真分数理论,可以进一步将真分数表示成与测验目的有关的有效分数V和与测验目的无关的系统误差分数SE之和:

T=V+SE。

这样,个体的测验分数可表示成

X=V+SE+E。

对于团体的测验分数方差,相应地有以下关系:

效度是测验有效性或准确性的指标,在理论上被定义为:有效分数方差与测验所得分数方差之比,即

这里,Val表示效度系数。

由效度的理论定义可以知道,效度系数Val的范围是[0,1]。

由于效度分析可以针对各种要求和运用各种程序,而在特定的条件下,使用不同的分析方法可以得到不同的效度。因此,一个测验可以具有不同的效度指标。当我们讨论一个测验的效度时,只有界定了它的条件,效度才有确切的意义。

2.效度与信度的关系

由测验分数方差的关系式可以知道,效度的提高受到信度的制约。

效度高的必要条件,但不是充分条件。

另一方面,降低信度,也会使效度降低。例如,测验信度和它的效标测量信度降低时,会使测验和效标之间的相关程度减弱(即效度降低)。为了估计测验与效标真分数之间的相关系数,可以用如下公式

校正。式中,rc是测验与效标真分数的相关系数,rxy是实得的测验分数与效标分数之间的相关系数,rxx、ryy分别是测验和效标测量的信度。由于相关系数|rc|≤1,所以由上式可知

当效标测量信度未知时,用其最大值代入,则有

由此可知,效度系数的最大值为信度系数的算术平方根。

3.影响效度的因素

影响测验的效度除了有测验本身、测验实施过程、被试主观状态等因素外,还有以下主要因素。

(1)受测样本

测验的效度系数是依据样本中的受测者在测验和效标上的得分,求其相关系数而得到的。一个测验施测于不同的样本,由于受测者在年龄、文化程度以及经验背景上的差别,效度就会随之不同,因此,受测样本的选取是用来考察效度所依据的重要因素。例如,初中学业成就测验,用初三毕业生的成绩作受测样本确定效度才是合理的。

样本容量的大小与效度系数的高低有一定关系。样本容量越大,测量误差就会有相互抵消的趋势,由此会有助于提高测验和效标测量的信度,同时有助于提高效度系数。

此外,样本的同质性也会影响效度系数。当测验的其他条件均相同时,样本的测验分数和效标分数分布范围越小,则效度系数就越小。因此,随机抽样可以保证样本中受测者的异质性,有利于提高效度系数。在估计预测效度时,如果测验分数的样本范围缩小,则会因测验分数分布范围的缩小而低估了测验的效度。例如,以高一数学期末考试的成绩为效标,估计初中升学考试的预测效度时,以进入高中的学生作为样本来计算二者的相关系数,却没有包括参加升学考试但在中专、技校、职校中学习和未进入各类学校的学生,这样就缩小了效标成绩的分布范围,因而会低估它的预测效度。为此可用公式

?

予以校正。式中,r是校正后的效度系数,r′是样本范围受到条件限制时的效度系数,Sx、S′x分别是两个样本范围内测验分数的标准差。

(2)效标

选择适当的效标是统计效度的先决条件。一个测验由于采用的效标不同,其效度可能会大相径庭。甚至,由于效标选择不当,可能导致无法衡量测验的效度。

二、常模参照测验的效度

对常模参照测验来说,主要有效标关联效度、内容效度和结构效度。

1.效标关联效度

测验

文档评论(0)

liwenfang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档