- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
《教化测量与评价》考点
测量的三要素
1、单位。
2、参照点。
3、量表。
由于制订量表的单位和参照点不同,量表的种类也不同,一般从低到高,分为四种水平:类别量表水平(称名量表)、依次量表水平(等级量表)、等距量表水平(等距量表)、比率量表水平(比率量表)。
教化评价与教化测量的关系
测量是依据肯定的法则和程序,对事物或现象在数量上的规定性加以描述和确定的过程;评价是泛指依据肯定的观念和标准衡量、推断人物或事物的价值。测量的结果只有通过评价的说明才能揭示其实际意义。测量是依据,评价是测量的详细体现。测量关切的是数量的多少,评价关切的是价值的凹凸;测量是纯客观的,评价带有主观性;测量是一种单一的活动,评价则是一种综合的活动。
教化测量就是借助肯定的工具,给教化现象赋值,来获得评价对象数量的方法。教化测量是教化评价获得数据资料的重要手段。教化测量可以为教化评价供应价值推断的基本数量事实,是教化评价的基础;教化评价是教化测量过程的持续,是对教化测量结果的说明与应用。
教化评价的功能
(1)导向功能。
(2)监督检查功能。
(3)激励功能。
(4)筛选择优功能。
(5)诊断改进功能。
1940年,泰勒教授提出了第一个报告,第一次提出了“教化评价”这个概念。
教化评价产生的标记是“八年探讨”;泰勒被称为“教化评价鼻祖”。
(一)稳定性系数(重测信度)
指用同一测验试卷,在先后两个不同时间内对同一组被试进行测验,两次测验实得分数的相关系数。这是最简洁的估量信度的方法。其大小等于同一组被试在两次测验上所得分数的积差相关系数。
练习题:对12名学生的英语听力先后进行施测,一个月内的两次测验成果如下表,试估计测验的信度系数。
学生序号
1
2
3
4
5
6
7
8
9
10
11
12
成果一
20
20
21
22
23
23
23
24
25
26
26
27
成果二
20
21
21
20
23
23
25
25
26
26
27
29
=0.94
(二)等值性系数(复本信度)
练习题:用A、B两份等值的英语听力难度测验,分别在上下午对10个学生进行测验,其测验结果如下表,试估计测验的信度系数。
学生序号
1
2
3
4
5
6
7
8
9
10
A测验
19
19
18
17
16
15
15
14
13
12
B测验
20
17
18
18
17
15
13
15
12
12
=0.9
小结:在实际测量中主要采纳计算信度系数的方法估计信度。依照计算方法的不同,可将信度分为4种:①再测信度:用一种测验对同一被试组施测两次,依据两次测验分数计算其相关系数。此种信度能表示两次测验结果有无变动,反映测验分数的稳定程度,故又称稳定性系数。在没有复本可用,而现实条件又允许重复施测时,一般采纳这种再测法来估计其信度。②复本信度:用一种测验的两个等值复本施测于同一被试组,然后计算两次得分的相关系数。一般说来,复本法是考查测验信度最好的方法。③内部一样性信度:测验的同质性程度。假如测验中各测题得分有正相关,则测验是同质的。考查测验内部一样性的常用方法有分半法、库德尔——理查森公式和克龙巴赫α系数。这样求得的信度系数也叫做内部一样性系数。分半法是考查测验信度最常用的方法,在测验没有复本且只能实施一次时,常用此法估计信度,即把测验题分成对等的两半(一般按奇数题和偶数题分),依据各人在这两半测验所得分数计算其相关系数,即得分半信度。但分半法实际只求得半个测验的信度,由于在其他条件相等的状况下,测验越长,信度越高,因此必需运用斯皮尔曼——布朗公式加以校正,以估计整个测验的信度。库德尔——理查森公式以测验各个项目的正确反应为基础,或依据各人总分的平均数和标准差计算信度系数,即得库德尔——理查森信度。它代表一切可能的分半信度系数的平均数。但库德尔——理查森公式只适用于答对一题得一分、答错无分的测验。克龙巴赫α系数则适用于多重记分的测验信度估计。④评分者信度:随机抽取数份试卷,由两位或两位以上评分者分别评分,然后计算每份试卷所评各分数之间的相关系数。在两人评阅数份试卷(或1人先后两次评阅数份试卷)时,用斯皮尔曼等级相关公式求相关;在3人以上评阅数份试卷时,则需计算肯德尔和谐系数。对一些无法完全客观记分的测验,常需考查评分者信度。以上计算信度系数的各种方法是以不同的假定和前提条件为基础的,故所求得的数值意义不尽相同,因而不能单以数值来比较其信度凹凸。
内容效度的检定方法:
(1)逻辑推断法。(2)比较平均数差异的显著性
(3)相关法
提高效度的方法
1、限制系统误差。效度的凹凸主要受到系统误差的影响。例如,仪器没有校准、题目和指导语有示意性。
2、细心编制量表。首先,测验内容要的确能反映测验目的;其次,题目表述必需清晰、简明,所
文档评论(0)