经典测评理论的发展、技术和运用.ppt

下载文档 降价啦

9
0
约4.8千字
约 45页
2017-08-12 发布于安徽
举报
版权申诉
保障服务

经典测评理论的发展、技术和运用.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

经典测评理论的发展、技术及运用西北师范大学教育科学学院吕国光 Email:lugg@ 吕国光生活小档案山茶书主要内容测评的含义及教育测评的历史发展经典测评理论实施的条件经典测评理论的实施技术及在教育评价中的运用测评的含义及教育测评的历史发展测评的含义教育测评的历史发展教育测评的含义和特点测评(Measurement):通常是指人们对客观事物进行某种数量化的测定。天平、秤、尺子、温度计。教育测评(Educational Measurement)：对学生的学习能力、学业成绩、兴趣爱好、思想品德以及教育措施上许多问题的数量化测定。主要用于对学生精神特性的测定。教育测评的含义和特点教育测评是困难的教育测评是可能的 Thordike（1918）说：“凡是存在的事物都有数量。” Mccall（1922）说“凡是有数量的都可以测量” 测量中的误差来源测量的仪器和设备所测量事物的一致性程度测量人的因素教育测评的含义和特点教育测评的特点教育测评一般是间接测评教育测评的度量单位是相对的教育测评是为实现教育目的服务的教育测评的历史发展主观经验性考试阶段（1864年以前）客观标准化测验阶段（1864-1940年）经典测评理论成熟和深入发展阶段（1940-）主观经验性考试阶段西周：“古之教者，家有塾，党有庠，术有序，国有学。比年入学，中年考校。一年视离经辨志，三年视敬业乐群，五年视博习亲师，七年视论学取友，谓之小成；九年知类通达，强立而不返，谓之大成。”（《学记》）隋炀帝大业二年（606年）分科考试。局限：题目数量少；评价缺乏客观的评分标准客观标准化测验阶段 1864年英国教师George Fisher收集许多学生成绩样本，分别优劣，汇集成《量表集》（Scale Book），作为度量学生各科成绩的标准。 1895年美国学者Rice主张用统一的测验考察、比较各校学生的成绩，并编制了算术、语言等测验。 1905年法国学者Binet和Simon制订的第一个智力量表。经典测评理论的成熟和深入发展 1940年由美国学者Tyler主持的“八年研究”结束，标志经典测评理论（Classical Test Theory CTT）的成熟。 1963年Cronbach发表了《概化理论：信度理论的丰富和发展》标志着概化理论（Generalizability Theory GT）的诞生。 1952年美国学者Lord创立了项目反应理论（Item Response Theory，IRT）经典测评理论实施的条件信度效度难度区分度一、信度(reliability)的意义概念:可靠性或可靠的程度信度指观测值和真值相差的程度信度指统计量与参数之间的接近程度信度是指一种测验对相同被试再次测验时引起同样反映的程度信度指观测值和真值相差的程度 X=T+E X表示观测值,T表示真值,E表示误差分数.在团体测验中, T可以理解为许多人(理论上应是无限多人)在相同条件下进行同类测量所获得的大量观测值的平均数.各人的真值与观测值之差仍称测量误差. E=X-T 由于测量误差是随机产生的,与真值无关.在理论上正的误差分数和负的误差分数相抵消,平均误差为0.根据这一假设,观测值的方差应等于真值的方差加上测量误差的方差.即: σx 2=σt 2 +σe 2 于是，信度（用rxx表示）可定义为真值方差（ σt 2）与观测值方差（ σx 2 ）的比率。即： rxx =σt 2/σx 2 此公式表明：真值的方差在观测值方差中所占的比重越大，则信度就越高。计算信度的公式 rxx =σt 2/σx 2 （1） σx 2=σt 2 +σe 2 （2） σt 2 =σx 2 -σe 2 （3） rxx =σt 2/σx 2 = 1- σe 2 / σx 2 （4）信度系数的计算稳定性系数稳定性系数（coefficient of stability）：用同一量表对相同被试在不同时间测验两次的观测分数的相关系数。稳定性系数的意义任何事物都在运动变化着，但也具有一定的稳定性，所以才能对事物进行测量和研究。教育测量也是假定所测量的特性处于相对稳定的状态，如果用同一种量表对相同的被试测量两次，其结果应相同或近似。换言之，测量结果应具有稳定性。例如，在一次测验中得高分的学生，在另一次测验中也有得高分的倾向，被试在两次测验中的相对地位也非常接近。这种稳定性也就表明测验结果是可靠的或信度高的。使用稳定性系数时要注意的问题两次测验的时间间隔要适宜；重测法适用于速度测验