测量03-测验的质量鉴定(信度).pptVIP

下载本文档

82
0
约7.33千字
约 45页
2018-05-15 发布于四川
举报
版权申诉

测量03-测验的质量鉴定(信度).ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

施测情境方面在实施测验时，考场是否安静，光线和通风情况是否良好，所需设备是否齐备，桌面是否合乎要求、空间阔窄是否恰当等等都可能影响到测量的信度。返回测量工具方面以测验为代表的心理与教育测量工具是否性能稳定是测量工作成败的关键。因此，弄清楚影响测量工具稳定性的因素是十分重要的。一般地，试题的取样、试题之间的同质性程度、试题的难度等是影响测验稳定性的主要因素。返回试题的取样试题的取样　如果一个测验的试题取样不当（或题目数目太少，或考察的方面不全面），则难以测查到被试心理特质的全面情况。若是被试采取押题方式应考，则所得结果的随机性更大。既然心理特质被考察的方面是随机的、测查的结果也是随机的，那么这种测量的信度就必然不高。相反，当一份测验中的同质性的题目数量增多之后，同一心理特质被考察到的次数就会增多，被试的成绩也就被有效地拉开。整个团体的测验分数分布就会更广，从而，提高测量的信度。试题的取样例如，有一个测验，由5道是非题组成。如果学生知道其中4题的正确答案，那么猜对另外1题的概率为0.5，凭猜测获得20%分数的可能性就很大。但是，另有一个测验，由50道是非题组成。如果学生知道其中40题的正确答案，那么猜对另外10题的概率为0.5的10次方，凭猜测获得20%分数的可能性就很小。试题的取样这种效果可用斯皮尔曼－布朗公式计算。公式中，n为改变后的测验长度与原来长度之比。R11为原测验信度，rnn为测验长度增加n倍后的测验的信度。下面看一个例子。例子　某一测验有10个项目，信度为0.60，问测验应增加到多少个项目，才能使信度达到0.90？解：由公式　　　　　　　得：即测验项目应增加到60个才能满足要求。返回试题之间的同质性程度　如果一个测验内部的试题之间彼此异质（即测查的是不同的心理特质），则无法使测量的内部一致性系数提高。返回试题的难度测验的难度与信度之间没有直接的关系。然而，当测验分数范围缩小时，信度将降低。因此，如果测验太难，大部分学生得高分；测验太易，大部分学生得低分。这两种情况都会减少分数分布范围而降低信度。一般说来，测题难度在0.3-0.7之间,且平均难度为0.5的测验，最有利于提高测验的信度。返回两次施测之间的间隔时间在计算重测信度和稳定性与等值性系数（复本信度之一）时，两次施测之间的间隔时间越短，其信度值越大；间隔时间越长，其他因素带来的影响的机会就越多，因而其信度值就可能越小。返回提高测量信度的常用方法适当增加测验长度（有两点要注意：新增项目与试卷中原有项目同质；新增项目的数量必须适度）使测验中所有试题难度接近正态分布，并控制在中等水平。这样测分也接近正态分布，标准差会较大。努力提高测验试题的区分度选取恰当的被试团体，提高测验在各同质性较强的亚团体上的信度。主试者严格执行实测规程。评分者严格按标准给分，实测场地按测验手册的要求进行布置，减少无关因素的干扰。返回几点说明本章所讨论的各种信度计算方法仅适用于常模参照测验。目标参照测验的信度问题必须以测量的概化理论（Generalizability Theory）为基础进行较好的处理，本章不讲。关于测量的信度要达到多高才被认为可靠？一般认为化能力或学绩测验信度应在0.90以上，人格测验的信度应在0.80以上，教师自编学绩测验的信度能达到0.60以上就应认为是较高信度的测验了。返回速度测验的信度在速度测验中，全部采用低难度的项目，所有项目都在被试的能力水平之内。但是规定的时限甚为严格，无人能够完成所有项目，每一被试的测验分数仅仅反映作业的速度。施测一次测验的信度系数，例如奇偶分半或库德——理查逊法，都不适用于速度测验，它们导致假性高相关。试举一个极端的例子。假设一个速度测验由50题组成，学生的得分完全取决于完成的项目数而不是错误率。这样，如果学生甲得44分，显然他答对22题奇数题和22题偶数题。同样，学生乙得34分，则奇数题和偶数题各得17分。结果，除去偶然答错的项目之外，奇偶测题分数就会完全正相关，但这并不表示速度测验的信度。补充内容估计速度测验的信度的方法：如果可以重复实施测验，那么使用再测信度。如果可以实施等值测验，那么使用复本信度。也可使用分半信度，但不是按照项目而是按照时间进行分半。一种方法是，奇偶项目分别印制在两张纸上，每组项目的用时各为全测验时间的一半。另一种方法是，把总时间四等分，算出每段时间的分数。在每段时间结束时，要求被试在所做项目上打个记号。把第1段和第4段时间内答对的项目数相加，得出一个半测验分数；把第2段和第3段时间内答对的项目数相加，得出另一个半测验分数。这种方法可以平衡练习、疲劳和其他因素的累积效应。谢谢！第四章测量信度