测验的信度测量的误差及其来源测量的信度补.PPTVIP

测验的信度测量的误差及其来源测量的信度补.PPT

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
测验的信度测量的误差及其来源测量的信度补

第三节 测验的信度 测量的误差及其来源 测量的信度 补: 测量的误差 2、误差的种类 随机误差与系统误差的比较 第一单元 信度的概念 二、信度的指标 1、信度系数与信度指数 信度系数是一种相关系数。 信度指数的平方是信度系数。 2、测量的标准误 信度越高,标准误越小;反之成立。 第二单元 信度评估的方法 (一)重测信度(Test-retest reliability) 第一,所测的心理特性必须是稳定的。 第二,遗忘和练习的效果基本上相互抵消。 第三,所测心理特质在两次施测的间隔时间内没有获得更多的学习和训练。 第四,报告结果时要报告两次测验的间隔及有关经历. (二)复本信度(Alternate-form raliability) 第一,前提是有复本测验。 第二,被试有条件接受两个测验(时间和经费等)。 第三,报告结果时要报告两次测验的间隔及有关经历. (三)内部一致性信度 1、分半信度(Split-half raliablity) 使用条件 测验只能施测一次或没有复本的情况下使用. 当一个测验无法分成对等的两半时不宜使用. 2、同质信度(Homogeneity raliability) 请给下面的作文评分: 热 夏天来临,总会伴随着一些炎热,我生在北方,却住在南方。对这南方北方的热,我可是深有体会。 南方的热是闷热,而北方的热多少有一些凉爽。处在南方,这热除了呆在家中,否则你是无法躲藏的。热不仅隐藏在太阳光中,而仿佛是一种弥漫在空气中的颗粒,古人说心静自然凉,我看恐怕无法适用于此,即使你在树荫中盘坐,豆大的汗珠还是会源源不断的流下来,就连风也是热的,在这种环境中学习和工作,心也难免有些浮躁了。在北方,天更蓝,太阳光感觉也更烈,但这并没有什么可担心的,走路走累了,就可以在树荫下歇一会,很快汗就消了,偶尔还会有几丝凉风吹来,使人难免有些惬意,也就可以忘记之前的辛苦,继续向下一个目的地进发。 南方的热就像是一场旷日持久的战争,而北方的热却并不赶尽杀绝,仍给人留有余地。在南方,白天和晚上几乎没有什么差别,昼夜温差很小,人们也自然严阵以待,丝毫不敢松懈,在三十几度的高温中坚持整个夏天。在北方,可就不一样,清晨和晚上是一天中最凉快的时候,几乎是只要没有阳光时就一点也不热。正常情况下,最高温度也就在30度左右,超过30度是很少的事,所以,人们也就不用紧张,可以放心的,踏踏实实的度过整个夏天。 。。。。 (四)评分者信度(Scorer raliability) 各种信度系数相应误差变异的来源 第三单元 信度与测验分数的解释 例:某受测者在WAIS上言语智商为102,操作智商为110。假设言语智商和操作智商的分半信度分别为了0.78和平利用0.88,问其操作智商是否显著高于言语智商呢? 4、确定信度的可接受水平 典型测验的一般标准 信度评价的一般原则 RXX ﹤0.70:不可靠,不能用; 0.70≦RXX ﹤0.85:可用于团体; RXX≧0.85:可用于鉴别个人. 几种典型测验的信度系数 友情提示 实际上,有多少种误差的来源,就有多少种信度估计的方法。一般来说,一个测验哪种误差大,就应该用哪种误差估计。有时一个测验需要几种信度估计。 操作演练 假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的A/B两个复本,所得的等值与稳定性系数为0.70。 我们还根据被试对每个复本的反应计算出分半信度为0.80. 同时,我们将另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。 然后,我们对这这三种方法所产生的误差变异进行分析。 一个假想测验的变异数分析 第四单元 影响信度的因素 测验长度 样本特征 测验难度 时间间隔 (一)测验长度 含义 测验试题的数量 (二)样本特征 特点 样本越异质,分数分布越广,有可能高估信度。 样本团体不同,信度就有可能不同 。 2、样本团体平均能力水平的影响 特点: 团体平均水平太高或太低,分布变窄,可能低估信度. 选择测验时应注意 取样团体的变异性和能力水平 建立信度的团体与欲测团体是否一致 (三)测验难度 难度对信度的影响只存在于某些测验中。 难度与信度间没有简单的对应关系。 一般趋势:测验太难或太易,分数范围缩小,降低信度. 智力的时间变化 信度的特殊问题 1、对于速度测验不存在评分者信度,也无法计算同质性信度。 2、当一个测验有几个分测验时,分测验的分数不如合成分数可靠。 思考 如何提高测量的信度? 适当增加测验的长度; 使测验项目的难度分布接近正态; 努力提高试题的区分度; 选取适当的被试团体; 主试严格执行测验规程; …… 几点说明 1.有多

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档