自学考试《教育测量》总复习课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自学考试《教育测量》总复习课件

教育测量 教育测量学知识结构 教育测量的含义 经典测量理论基本知识 测验的质量分析 测量项目难度、区分度 测验信度、效度 测验分数的解释与应用 测量的主要类型与应用 学业成就测验 心理测验 第一章:教育测量的含义与经典测量理论 教育测量的基本概念 测量误差 经典理论测量 教育测量 测量:依据一定的法则使用量具对事物的特征进行定量描述的过程 测量的三个要素: 一定的法则 事物的特征 定量描述 教育测量:根据一定的心理学与教育学理论,使用测验对人的心理特征和教育成就进行描述的过程 教育测量的特点: 间接性 相对性 测量误差 测量误差 系统误差 随机误差 测量误差的来源: 测量工具 施测对象 施测过程 经典测量理论 数学模型:X=T+E,即观测分数(X)与真分数(T)之间是一种线性关系,差一个随机误差(E) 三个假设为: (1)用平行测验测量次数足够多,则观测分数平均值接近真分数,ε(X)=T。 (2)真分数和误差分数相关为零,ρET=0。 (3)各平行测验上的误差分数相关为零,ρET=0。 第(1)条说明E是个服从均值为零的正态分布的随机变量。第(2)(3)说明E是个随机误差,没有包含系统误差在内。 第二章:测量的质量分析 测验难度 测验区分度 测验信度 测验效度 难度 难度:被试完成题目(item)任务时所遇到的困难程度 难度系数:定量地刻画被试作答题目时困难程度的量值,用P表示。 难度系数的估计 全体考生得分率(或失分率) 高低分组法:两端组被试(各27%)得分率的均值 难度对测验的影响 测验难度影响测验分数的分布形态 测验项目的难度普遍较大时,被试的分数普遍较低,分数集中于低分段,分数分布呈正偏态 测验项目的难度普遍较小时,被试的分数普遍较高,分数集中于高分段,分数分布呈负偏态 测验难度影响测验分数的离散程度 过难或过易的测验会使分数集中于低分或高分端,使测验全距减小 当难度集中在0.5附近时,分数分布的范围较广,方差较大 测验难度水平的确定 对于标准参照测验,可以不必过多考虑测验难度,主要依据内容的重要程度 对于选拔录用人员的考试,应该将项目的难度控制在接近录取率左右 对于常模参照测验,目的是尽量拉开被试的个体差异,应当控制整个测验的平均难度尽量接近0.5(测验项目的难度全距在0.3~0.7之间,平均难度0.5左右) 项目区分度 区分度:题目区分被试能力、水平的能力,又称鉴别力,用D表示。 区分度的估计方法 相关法:计算题目得分与总分相关。其中 积差相关适用于多值计分题目; 点二列相关适用于二值计分题目。 高低分组法:以高分组和低分组在特定题目上得分率之差作为衡量区分度的指标。 项目区分度 区分度的一般评价标准 0.2以下 应淘汰; 0.2~0.3 合格题目,可能需加以改进; 0.3~0.4 良好; 0.4~1 性能颇佳。 测验题目难度与区分度的关系 题目难度、区分度与测验信、效度之间关系复杂。 测验中题目的总体难度过高或过低,都会导致测验的总体区分能力降低。所以一般说来,中等难度的题目应占40—60%。 信度 概念: 测验在测量它所测特质时得到的分数(测值)的一致性 反映测验控制误差的能力 反映了测量结果的稳定性程度 信度的种类: 重测信度 分半信度 内部一致性信度 信度的应用 提高测验信度的方法 重测信度 概念: 同一测验向同一批被试反复施测两次所得结果的一致性程度 这两次施测分数的相关系数,就可以作为测验信度的估计值 使用条件: 所测量的心理特质必须是稳定的 遗忘和练习效应基本相互抵消 在两次时间间隔之内,被试在所要测查的心理特质方面没有获得更多的学习和训练 平行测验:两个测验所测的实质完全相同,只是使用的具体测验项目不同,并且所测的内容范围、测验难度、试题类型以及测验长度与时限等其他方面均相等 分半信度 概念:一个测验分数分成对等两半后,所有被试在这两半上所得分数的一致性程度。 斯皮尔曼-布朗公式:r=2r/(1+r) r’ 注意: 分半信度会低估信度 明确“分半”的含义 α信度 概念:测验内部所有题目间的一致性程度 实质是测验所有分半信度的平均 信度系数的应用 估计测验标准误 针对被试测验分数进行区间估计 例题:书中p136 信度的影响因素 被试方面: 身心状况、应试动机、注意力、作答态度等 整个被试团体的异质性 主试方面: 是否按照指导手册施测 评分标准是否统一 施测情境: 考场环境是否安静、温度、光线等、所需设备是否齐全 测量工具: 试题取样是否合适、试题难度 两次测验的时间间隔 提高信度的方法 适度增加测验的长度 是测验中所有的试题的难度接近正态分布,并控制在中等水平 努力提高测验的区分度 选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度 主试严格执行施测规程,

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档