教育测量评价概述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
再用斯皮尔曼——布朗公式矫正 斯皮尔曼——布朗公式: 第三节 提高测验信度的方法 一、分数不同分布范围的信度系数 可见,分数分布的范围越大,即变异数越大,则信度系数越高;分数分布的范围越小, 即变异数越小,则信度系数趋向于降低。 由此可见,分数的分布范围对信度有很大的影响。所以要加大考生间的变异数,必须扩大样本并坚持随机抽样,将有助于提高信度。 二、测验的长度和信度 增加测验的题目,延长测验的长度,不仅可以缩小试题抽样的偶然因素的影响,也可以使学生扩大得分的范围,愈能反映学生的真实水平,使信度系数增大,提高测验的信度。 测验长度和信度的关系,可用斯皮尔曼——布朗公式表示: 式中: rtt:原测验长度增加到K倍时的信度系数 rXX:原测验的信度系数 K:比原测验长度延长的倍数 练习:有一测验,原有10道题,信度系数为0.33,如把测验增加到原测验的4倍,其信度系数即为?如果将题目数增加到原测验的8倍,其信度系数即为? 把测验增加到原测验的4倍,其信度系数为: 把测验增加到原测验的8倍,其信度系数为: 从斯皮尔曼——布朗公式知道,由于测验长度增加,信度就得到了提高。但这二者并不是等比例的关系。从表3-17,可以看出测验长度和信度的关系。 表3-17 测验长度和信度的关系 题数 比原测验题增加的倍数 信度 5 10 20 40 80 160 320 640 1 2 4 8 16 32 64 128 0.20 0.33 0.50 0.66 0.80 0.89 0.94 0.97 由斯皮尔曼——布朗公式推导出求K的公式: 斯皮尔曼——布朗公式 求K的公式: 式中: rtt:原测验长度增加到K倍时的信度系数 rXX:原测验的信度系数 K:比原测验长度延长的倍数 练习:假设原测验10题,其信度系数为0.33,试问该测验要加长几倍才能把信度系数提高到0.90? 已知rXX=0.33 rtt =0.90 10×18倍=180题 必须将测验增长至原长度的18倍,增为180题,才能将信度系数从0.33提高到0.90。 运用斯皮尔曼——布朗公式来延长测验长度从而提高信度,它是建立在统计和心理两个假设基础上的。 统计学上的假设: 用来增加原测验长的材料和原测验有相同的统计性质。 心理学上的假设:延长测验将不改变考生回答问题的方法。 三、测验的难度与信度 测验的难度与信度的关系,从信度的理论公式可以看出: 可以看出:测验分数的方差会影响信度的估计 即测验分数的方差sX2大时,则信度系数偏高,若sX2小时,则信度系数偏低。 所以,如果测验项目太容易,则大部分考生都得高分;或测验项目太难,则大部分考生都得低分,这两种情况测验分数的个别差异都会很小, 即sX2变大,信度偏于低估,而使测验结果不可靠。 作为一个理想的常模参照性测验的难度,应使考生的得分散开,分布在整个量尺的范围,而不是集中在一起。 如果测验项目太难或太易,考生得分都会集中在一起,如果用一个标准化的常 模参照性测验来鉴定学生之间的差异,该测验的平均难度,应取做对题目数占50%的难度上,并使全部考生的得分大致分布在近于0分到近于100分的范围内。 如果把做对50%的测验项目定为测验的平均难度,其测验的项目类型,应是简答型试题。 如果测验的项目是二择一的是非题,或五择一的选择题,因做对的项目数中包括有猜对的因素,所以理想的平均难度还应定得高一点,这种题的平均难度应放在猜对所得分数至最高可能得分的中点。 如,由100个是非题组成的测验,其平均难度 应取做对75题(50题至100题的中点) 由100个是非题组成的测验,其平均难度应取做对60题(20题至100题的中点) 假如我们编制的测验能符合上述理想的难度水平,就可以提高测验的信度,测验的结果将是可靠的。 四、测验内容的同质性与信度 同质的测验内容,可以使信度偏高。因此为了提高信度,要求测验内容应具有同质性,不要在一个测验中安排许多性质不同的内容,致使测验结果不可靠。 五、评分客观与信度 练习1: 设对8名学生进行数学测验,为了考查这个测验的信度,1个月后对同一组学生用原试卷再次测验,两次测验成绩如下表,估

文档评论(0)

a1166671 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档