经典测评理论的发展、技术和运用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
经典测评理论的发展、技术及运用 西北师范大学教育科学学院 吕国光 Email:lugg@ 吕国光生活小档案 山 茶 书 主要内容 测评的含义及教育测评的历史发展 经典测评理论实施的条件 经典测评理论的实施技术及在教育评价中的运用 测评的含义 及教育测评的历史发展 测评的含义 教育测评的历史发展 教育测评的含义和特点 测评(Measurement):通常是指人们对客观事物进行某种数量化的测定。天平、秤、尺子、温度计。 教育测评(Educational Measurement):对学生的学习能力、学业成绩、兴趣爱好、思想品德以及教育措施上许多问题的数量化测定。主要用于对学生精神特性的测定。 教育测评的含义和特点 教育测评是困难的 教育测评是可能的 Thordike(1918)说:“凡是存在的事物都有数量。” Mccall(1922)说“凡是有数量的都可以测量” 测量中的误差来源 测量的仪器和设备 所测量事物的一致性程度 测量人的因素 教育测评的含义和特点 教育测评的特点 教育测评一般是间接测评 教育测评的度量单位是相对的 教育测评是为实现教育目的服务的 教育测评的历史发展 主观经验性考试阶段(1864年以前) 客观标准化测验阶段(1864-1940年) 经典测评理论成熟和深入发展阶段(1940-) 主观经验性考试阶段 西周:“古之教者,家有塾,党有庠,术有序,国有学。比年入学,中年考校。一年视离经辨志,三年视敬业乐群,五年视博习亲师,七年视论学取友,谓之小成;九年知类通达,强立而不返,谓之大成。”(《学记》) 隋炀帝大业二年(606年)分科考试。 局限:题目数量少;评价缺乏客观的评分标准 客观标准化测验阶段 1864年英国教师George Fisher收集许多学生成绩样本,分别优劣,汇集成《量表集》(Scale Book),作为度量学生各科成绩的标准。 1895年美国学者Rice主张用统一的测验考察、比较各校学生的成绩,并编制了算术、语言等测验。 1905年法国学者Binet和Simon制订的第一个智力量表。 经典测评理论的成熟和深入发展 1940年由美国学者Tyler主持的“八年研究”结束,标志经典测评理论(Classical Test Theory CTT)的成熟。 1963年Cronbach发表了《概化理论:信度理论的丰富和发展》标志着概化理论(Generalizability Theory GT)的诞生。 1952年美国学者Lord创立了项目反应理论(Item Response Theory,IRT) 经典测评理论实施的条件 信度 效度 难度 区分度 一、信度(reliability)的意义 概念:可靠性或可靠的程度 信度指观测值和真值相差的程度 信度指统计量与参数之间的接近程度 信度是指一种测验对相同被试再次测验时引起同样反映的程度 信度指观测值和真值相差的程度 X=T+E X表示观测值,T表示真值,E表示误差分数.在团体测验中, T可以理解为许多人(理论上应是无限多人)在相同条件下进行同类测量所获得的大量观测值的平均数.各人的真值与观测值之差仍称测量误差. E=X-T 由于测量误差是随机产生的,与真值无关.在理论上正的误差分数和负的误差分数相抵消,平均误差为0.根据这一假设,观测值的方差应等于真值的方差加上测量误差的方差.即: σx 2=σt 2 +σe 2 于是,信度(用rxx表示)可定义为真值方差( σt 2)与观测值方差( σx 2 )的比率。即: rxx =σt 2/σx 2 此公式表明:真值的方差在观测值方差中所占的比重越大,则信度就越高。 计算信度的公式 rxx =σt 2/σx 2 (1) σx 2=σt 2 +σe 2 (2) σt 2 =σx 2 -σe 2 (3) rxx =σt 2/σx 2 = 1- σe 2 / σx 2 (4) 信度系数的计算 稳定性系数 稳定性系数(coefficient of stability):用同一量表对相同被试在不同时间测验两次的观测分数的相关系数。 稳定性系数的意义 任何事物都在运动变化着,但也具有一定的稳定性,所以才能对事物进行测量和研究。教育测量也是假定所测量的特性处于相对稳定的状态,如果用同一种量表对相同的被试测量两次,其结果应相同或近似。换言之,测量结果应具有稳定性。例如,在一次测验中得高分的学生,在另一次测验中也有得高分的倾向,被试在两次测验中的相对地位也非常接近。这种稳定性也就表明测验结果是可靠的或信度高的。 使用稳定性系数时要注意的问题 两次测验的时间间隔要适宜; 重测法适用于速度测验

文档评论(0)

youyang99 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档