北师社教育测量与评价(修订版)教学课件第二章_教育测量的基本理论与质量特性.pptxVIP

  • 2
  • 0
  • 约3.65千字
  • 约 72页
  • 2026-03-07 发布于广东
  • 举报

北师社教育测量与评价(修订版)教学课件第二章_教育测量的基本理论与质量特性.pptx

第二章教育测量的基本理论与质量特性

;本章要点;学习目标;第一节教育测量的基础理论;一、经典测量理论

;(一)经典测量理论的发展历程

;(二)经典测量理论的重要概念;(三)经典测量理论的基本假设

;(四)经典测量理论的两个重要推论

;(五)经典测量理论的优点和局限性

;(六)经典测量理论的应用与实践;二、项目反应理论;(一)项目反应理论的发展历程;(二)项目反应理论的概念及重要参数;(三)项目反应理论的基本假设;(四)项目反应理论的经典模型;当猜测参数和区分度参数都很小,即ci=0,ai=1时,此时便可以使用单参数Logistic模型,表达式为:

其中,i代指某一测验项目

ai表示测验项目i的区分度参数,其数值大小与测验项目对受测者的区分程度呈正相关;

bi表示测验项目i的难度参数,其数值与经典测量理论中测验项目的难度系数呈负相关;

ci表示测验项目i的猜测参数,其数值大小与项目被猜对的概率呈正相关;

e表示自然对数之底,约为2.71828。

;(五)项目反应理论的优点和局限性;局限性:

(1)该理论基于特定的数学模型和公式,同时需要大量的样本容量和测验项目量,对测试条件有一定的要求。

(2)项目反应理论的数学模型相对复杂,对于一般使用者来说,可能需要进行较长时间的学习和培训,对操作者有一定的专业要求。

(3)项目反应理论忽视了其他特质或能力对受测者反应的影响,与实际生活有所偏离,并未得到有效验证。

;(六)项目反应理论的应用与实践;第二节教育测量的质量特性;一、信度

(一)信度的定义;(1)信度指实际值与真值相差的程度

;(2)信度指统计量与参数之间的接近程度

;2.信度的理论公式

;由此公式可知,信度的取值范围是[0,1],也就是当两次测试的得分相关系数越高时,即相关系数接近于1,就意味着两次测量具有更高的一致性和可靠性,信度也就越高;

而如果相关系数接近于0,则说明两个变量之间没有线性相关性。

;3.信度的意义

;(二)信度的估算

;(1)估算方法

;∑XY为每个被试两次测验所得分数乘积之和,

∑X为每个被试第一次考试分数之和,

∑Y为每个被试第二次考试分数之和,

∑X2为每个被试第一次考试分数平方之和,

??Y2为每个被试第二次考试分数平方之和。;(2)局限性;2.复本信度的估算;∑X为每一个被试第一次测验分数之和,

∑Y为每一个被试第二次测验分数之和,

∑X2为每一个被试第一次测验分数平方之和,

∑Y2为每一个被试第二次考试分数平方后之和;3.同质性信度的估算

;(1)同质性信度的估算方法;(2)局限性

;4.评分者信度

;(三)提高测验信度的方法;3.如何提高测验信度

(1)适当增加测验题目的数量

(2)测验的难度适中

(3)测验的内容应尽量同质

(4)测验的程序应统一

(5)测验的时间要充分

(6)评分要尽量做到客观化,减少评分误差

(7)被试情绪要平稳;二、效度

(一)效度的概述

;2.公式

被试的观察分数与一般真分数与误差分数的关系用公式表示为:X=T+E

X为观察分数

T为一般真分数

E为误差分数

而一般真分数可分为目标真分数(V)和非目标真分数(I)

目标真分数是指在测试或测量中,被测者在其所要测试的领域或特质上所真实展现的水平

非目标真分数是指在测试或测量中,被测者在非目标领域或特质上所展现的水平

由此可知:X=V+I+E。

;效度与目标真分数与观察分数方差的关系可用公式来表达:

由计算公式可知,随机误差分数的方差之和越小,则效度越高。高信度是高效度的必要条件,但高信度并非高效度的充分条件。

;3.意义

对于教育测量,效度尤为重要。在教育测量中,评估的对象大多是学生的学习成绩、态度、价值观和技能等内容,而非客观的物理事物。这些特质无法直接量化或测量,因此测量工具的效度至关重要。由于教育测量对象是人,因此具有主观性,对被测量特质的准确性和可靠性要求尤为严格。在教育测量中,学生的学业成绩和能力评估是至关重要的,这些评估结果直接影响到教学和学生未来的发展方向。因此,测验工具的效度必须得到重视,以确保其可以准确地反映学生的学术表现、态度、价值观和技能等精神现象,保证评估结果的准确性和可信度,为教育决策提供可靠依据,帮助教育工作者更好地理解和满足学生的学习需求,从而提高教育质量。;(二)效度的估算

;(1)内容效度的验证方法

;(2)局限性和问题

;问题:

需要区分的是内容效度与表面效度。

表面效度是指一个测验或测量工具外在形式上是否与所要测量的特质或概念相符合,以及在被测者那里有信服力并被认可。它并不评估测验结果是否准确,而是关注测验的外部表现和被测者对测验的接受程度。

内容效度更专注于测验题目本身是否覆盖了所要测量的内容领域。

文档评论(0)

1亿VIP精品文档

相关文档