2.2效度.docVIP

下载本文档

15
0
约4.59千字
约 6页
2017-06-15 发布于河南
举报
版权申诉

2.2效度.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2.2效度

第二节效度　　(即数值与单位)可以对所要测量物体的属性给出明确的意义。但在教学测量中，用分数描述行为反应的心理属性，它的意义就不那么明确了。例如，学生的某次数学测验成绩是依赖他们掌握语文或物理的知识和能力所得到的，那么这次数学成绩在很大程度上并不能反映所要测量的逻辑思维、运算和空间想象等方面的心理属性。因此，需要考察测验到底测量了哪些心理属性，对这些心理属性能够测量到什么程度，这就是测验的有效性。为了估计测验的有效性，需要建立参照标准。我们常常把反映某种属性的有效客观标准称作效标。它可用一份测验卷来体现，用这份测验卷去测试学生称作效标测量，由此得到的分数称作效标分数。　　一个测验的有效性，必须着眼于该测验本身所具有的独特的目的、功能和适用范围。对于某种独特的目的、功能和适用范围是正确、有效的测验，对另一种目的，功能和适用范围可能就是不正确、无效的。不存在对于任何目的、功能和适用范围都有效的测验。此外，由于测验是通过行为样本，对特定的某种属性作间接测量，它只能达到某种程度的正确性，一般用两个测验分数之间的相关系数表示，这种相关程度越高，可称该测验的效度越好。因此，只有程度上的不同而不存在全有或全无的差别，而且测验的有效性是相对的。　　一、效度的概念　　1　　V和与测验目的无关的系统误差分数SE之和： T＝V＋SE。　　这样，个体的测验分数可表示成 X＝V＋SE＋E。　　对于团体的测验分数方差，相应地有以下关系：　　　效度是测验有效性或准确性的指标，在理论上被定义为：有效分数方差与测验所得分数方差之比，即　　Val表示效度系数。　　Val的范围是［0，1］。　　由于效度分析可以针对各种要求和运用各种程序，而在特定的条件下，使用不同的分析方法可以得到不同的效度。因此，一个测验可以具有不同的效度指标。当我们讨论一个测验的效度时，只有界定了它的条件，效度才有确切的意义。　　2 　　效度高的必要条件，但不是充分条件。　　(即效度降低)。为了估计测验与效标真分数之间的相关系数，可以用如下公式　　rc是测验与效标真分数的相关系数，rxy是实得的测验分数与效标分数之间的相关系数，rxx、ryy分别是测验和效标测量的信度。由于相关系数|rc|≤1，所以由上式可知　　当效标测量信度未知时，用其最大值代入，则有　　由此可知，效度系数的最大值为信度系数的算术平方根。　　3 　　(1) 　　样本容量的大小与效度系数的高低有一定关系。样本容量越大，测量误差就会有相互抵消的趋势，由此会有助于提高测验和效标测量的信度，同时有助于提高效度系数。　　此外，样本的同质性也会影响效度系数。当测验的其他条件均相同时，样本的测验分数和效标分数分布范围越小，则效度系数就越小。因此，随机抽样可以保证样本中受测者的异质性，有利于提高效度系数。在估计预测效度时，如果测验分数的样本范围缩小，则会因测验分数分布范围的缩小而低估了测验的效度。例如，以高一数学期末考试的成绩为效标，估计初中升学考试的预测效度时，以进入高中的学生作为样本来计算二者的相关系数，却没有包括参加升学考试但在中专、技校、职校中学习和未进入各类学校的学生，这样就缩小了效标成绩的分布范围，因而会低估它的预测效度。为此可用公式 ? 　　r是校正后的效度系数，r′是样本范围受到条件限制时的效度系数，Sx、S′x分别是两个样本范围内测验分数的标准差。　　(2) 　　选择适当的效标是统计效度的先决条件。一个测验由于采用的效标不同，其效度可能会大相径庭。甚至，由于效标选择不当，可能导致无法衡量测验的效度。　　二、常模参照测验的效度　　对常模参照测验来说，主要有效标关联效度、内容效度和结构效度。　　1　　(如国家级高考、省级各类会考等)，所以它具有有效的客观标准效应。选择适当的效标是件既重要又困难的工作，需要根据不同的测验类别有区分地加以选择。例如教学测验可以采用相应的学科成绩或教师评定的等级作为效标，但不能用某种特殊能力或特殊训练的成绩作效标。效标还可能随着时间和个别差异的变化而改变。因此，效标需要有一定的可靠性(即信度)。　　 (又可称准则关联效度)。这里以测验分数与其效标分数之间的相关系数来表示效度系数。根据效标资料收集的时间，又可分为共时效度和预测效度。共时效度的效标资料可以与测验同时收集，它是以测验分数与现有效标分数之间的相关系数表示效度，所关心的是测验是否取代了效标的有效性。预测效度的效标资料需要经过一定时间以后才能收集，它是以测验分数与其未来效标分数之间的相关系数表示效度，所关心的是受测者的测验分数对于其未来成就预测的有效程度。　　由于测验分数和效标分数这两个变量的类型不同，两者的相关系数计算方法也不同。以下介绍几种常用的方法。　　　　15名学　　(见表2－