第三章 教育测量与评价的质量特性.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

单元/章节名称

第三章教育测量与评价的质量特性

学时

3

学期总课次

授课时间

第周,星期,第节

学习目标

1.解释信度。

2.解释效度。

3.解释难度。

4.解释区分度。

5.依据不同情况采用恰当的方法计算测验的信度。

6.依据不同情况选用恰当的方法对测验的效度进行评价。

7.计算测验题目的难度、区分度。

8.反思教育测量与评价方案的可用性。

教学重点

及解决措施

重点:信度、效度、难度、区分度的定义和类型。

解决措施:

教学难点

及解决措施

难点:能够根据不同情况选择合适的信度、效度计算方法,正确计算难度和区分度。

解决措施:通过引入生活种的相关案例,请学生分组讨论,判断并说明理由。

教学反思

授课内容及教学活动设计

附注(教学方法、活动形式、辅助手段等)

课堂导入:

体检时,用同一台体重秤连续称重三次,如果读数不一致,比如第一次45kg,第二次55kg,第三次49kg,那么这台体重秤可信吗?请思考什么是信度?

新授课:第一节教育测量与评价的信度

一、信度的意义

信度(reliability),简单地说就是测量结果的可信程度。信度指的是测量结果的稳定性程度,记为rxx。

教育与心理测量不同于物理测量,人们不可能用同一测量工具反复测量一个人的同一心理特质。

二、信度的统计定义

我们不妨把测验实施过程中直接得到的分数,叫做观察分数,记为X;把被试在所测特质上客观具有的水平值,叫一般真分数(简称真分数),记为T;那么,观察分数与一般真分数的差就是测量误差,记为E。这样,三者的关系可以表示为:

X=T+E(3-1)

三、信度的估计方法

(一)重测信度(testretestreliability)

重测信度指的是用同一个量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。

(二)复本信度(alternateformsreliability)

复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。

(三)同质性信度(homogeneityreliability)

同质性信度也叫内部一致性信度(internalconsistencyreliability),它是指测验内部所有题目间的一致性程度。

1.分半信度(splithalfreliability)

2.库德—理查逊信度(KuderRichardsonreliability)

3.克龙巴赫(cronbach)α系数

当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫α系数。

四、标准参照测验的信度分析

1.百分比一致性指标

百分比一致性(percentagreement,简称PA)指标是指同一测验或两平行测验先后两次施测,其对被试的分类结果一致的比例。

2.κ一致性系数

κ一致性系数(kappacoefficientofagreement),是指实际被评定为一致的百分比与在理论上被评定为一致的最大可能次数百分比的比率。

五、测量标准误与测验信度的关系

测量标准误是指测验中所得测值偏离真分数的程度,记为SE。显然,它与测验信度系数之间存在着必然联系,这种关系可定量地表示如下:

SE=Sx1-rxx(3-15)

式中,SE为测量的标准误,Sx为观察分数的标准差,rxx是测量的信度系数。

测量标准误是反映测量结果精确性和可靠性的又一指标,同时也是人们正确解释测验分数的科学依据。

六、评分者信度

1.评分者信度的含义

评分者信度(scorerreliability)指的是多个评分者给同一批人的答卷进行评分的一致性程度。

2.评分者信度的计算

第二节教育测量与评价的效度

一、效度的意义

效度是指一个测验或量表实际能测出其所要测量的特性的程度。

1.效度始终是针对一定测量目的而言的

2.效度只有程度上的差异

3.效度是针对测量结果而言的

4.评价一个测量是否有效要多角度、多方面地收集证据

二、效度的统计定义

实质上,一般真分数还可进一步分解为两个部分:目标真分数(记为V)和非目标真分数(记为I)。目标真分数,指的是反映被试某种心理特质真正水平的数值。非目标真分数,指的是被试在某种心理特质测量量表上表现的与测量目标无关的稳定测值。所以观察分数可表示为:

X=V+I+E(3-18)

由以上论述可以看出,测量效度实质上就是指一次测量测出目标真分数的程度。

课堂讨论题

从统计学定义看,效度和信度有什么关系?

三、内容效度及其分析方法

(一)内容效度的含

文档评论(0)

释然 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档