教育统计与测量测量质量研究分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
折半法(经校正)求信度系数,可以看成在测验内部求项目间的相关;研究说明,求a-系数,也可看成在测验内部求项目间的相关。因此,折半相关系数和a-系数都被叫做测验的内部一致性系数。 测验的内部一致性系数取值高,说明测验项目同质性好,都在有效测查同一特质。 教育统计与测量测量质量研究分析 信度系数的应用 信度系数取值大,所得测值偏离真分数值的幅度就小,误差就得到了较好控制。而实际测验中所得测值偏离真分数的程度,被叫做测量标准误差。可记为SEM,它跟信度系数之间显然存在着必然的联系。这种关系可定量地表示为: rxx是测验的信度系数; SX是被试在该测验上所得观察分数的标准差。 假设52名被试在拼写测验中,所得分数的标准差SX=9.48,已知拼写测验的信度系数rxx=0.92,按照上述公式,该测验的测量标准误为: 也就是说,该拼写测验所测52名被试的真分数,并不恰好就是所测到的观察值。观察分数与真分数有一定程度的偏离,大约偏离2.68分。就最高分59分的被试来说,其真分数值应为59+2.68=61.68(分),或59-2.68=56.32(分),或其间的任何一个值。 教育统计与测量测量质量研究分析 从以上公式可以看出,测量标准误的大小,取决于测验值信度系数rxx取值的高低。rxx 值越高,则观察分数偏离真分数越小。 假设上述例子中测验的信度为0.82,则其SEM=4.02;如果信度为0.98,则其SEM=1.34. 一个测验其信度系数rxx的取值处在0.00和1.00之间;当然值越高越好。一般来说,公开大规模使用的标准化测验,其信度系数的取值不应小于0.90;主要用来起预测作用的标准化测验,希望能更大一点,最好能接近或大于0.95;当然,教师自编的课堂测验,对其信度系数值的要求就不能过高 教育统计与测量测量质量研究分析 测验效度 测验效度,就是测验实际上测到它打算要测的东西的程度。 真正测到了要测的东西,就是有效、效度高;否则,就是无效或不十分有效,就是效度低。显然,测验只有真正测到了要测的特性、特质、结构,测验结果即测验分数的应用与解释,才能起到它应起的作用,才能发挥出有效性。 因此,测验效度就是测验工具的正确性问题,是测验分数的真实有效性问题,是测验质量高低的根本表现所在,是测验性能的最重要的指标。 教育统计与测量测量质量研究分析 心理与教育测量具有间接性特点,所测对象是被试的内部心理特性、特质或结构,测量工具是否真正测到了它,绝非一目了然,而且,这种特性、特质、结构本身到底什么样,许多都没有公认的定义,甚至还存在严重的分歧。 如语言能力和水平,就是一个不很清楚概念,它的内涵与外延是什么,存在着分歧,那测量语言能力就存在着很大的困难。也许目的是测量语言能力但是实际测到的是语言知识。 教育统计与测量测量质量研究分析 教育统计与测量测量质量研究分析 教育统计与测量测量质量研究分析 测量质量分析 难度与区分度 信度与效度 教育统计与测量测量质量研究分析 为了使测验得到的分数准确可靠,我们要求使用的测验是高质量的,因此必须对分析测验的质量,而测验又是由一个个题目或者说测试项目所组成,整个测验质量要高,必然要求各个题目的质量要高。 因此分析一个测验的质量,一般就要从两个方面来进行:一是考察整个测验的质量指标,即考察测验效度与信度;二是考察所含项目的质量指标,即考察测验项目的难度和区分度。 教育统计与测量测量质量研究分析 测验项目的难度 测验项目的难度,就是被试完成项目作答任务时所遇到的困难程度。 有的项目很容易,几乎所有初试都能正确完成作答任务;有的项目却很难,只有少数高水平被试能正确完成任务。 困难的项目,被试在其上得分的可能性就小,失分的可能性就大;容易的项目,被试在其上得分的可能性就大,失分的可能性就小。 总之,每一个测验项目都有自己的难度;不同项目间其难度常常是不同的。 定量刻画一个测验项目的被试作答困难程度的量数就叫项目的难度指数或难度系数。 教育统计与测量测量质量研究分析 难度系数的求法 最通用的项目难度系数的求法就是计算被试在项目上的得分率或者说通过率。 像选择题这种测验项目,评分采取“全或无”的方式,答对给满分,答错给零分,难度指数就可以求通过人数比例或称通过率。 对于不采用“全或无”的方式给分的测验项目,难度系数的求取方法是先求所有被试在该项目上的平均得分值,可记为 ;再用它去对测验项目总分(满分),可记为K,求比值,这个比值就是全体被试在该测验项目上的得分率即难度指数p了。 R通过人数 n 接受测试的总人数 P难度指数 教育统计与测量测量质量研究分析 例如,有一满分值K=5的试题,测试10名被试,实得成绩为5,3,4.5,2,5, 0, 3.5, 1,3, 4 要求其难度指数p。 先求平均得分 然后用平均得分

文档评论(0)

smartxiaohuli + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档