05939教育科学方法论--11教育测量法.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
05939教育科学方法论--11教育测量法

含义:是衡量测验的准确性和有效性的指标。亦即测量的结果是否真实、客观地反映了受测者的实际水平。 (一)效度 * 提高效度的注意事项: (1)要控制系数误差,即控制测验过程的误差; (2)精心编制测题,分析教学目标,编制双向细目表,测题表述简明易懂,测量有必要的覆盖面。 (3)妥善组织测验。 * (二)信度 信度(reliability):指的是测量结果的稳定性和可靠性的程度。是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。 * 提高测量信度的方法 1.测题要有一定数量 延长测验的长度,既可排除试题抽样的偶然性因素,也有可能扩大得分的范围,因而使信度系数增大,测验信度提高。 2.测题难度适中 3.测题内容要有同质性,不要包含过多性质不同的内容 4.测验时间要充分 5.评分要客观 * 难度是指题目的难易程度。表示题目难易程度的数量,称为题目的难度指数,一般用P来表示。 由于测题记分的方法不同,所以难度的估计方法也不同。通过试题的人数与总人数之比,多用于选择题;被测者所得分数的平均值与该题满分之比,多用于问答题。其值越小,题目越难。 录取率越低,对试题难度的要求越高。 (三)难度 * 1. 在计算客观题的难度时,它就是受测者在回答该题目时 正确回答的人数在全体受测者中所占的比例。 2. 当题目的分数为多值时(包括主观题或一些分步解答的题目),难度就是全体平均分与题目满分的比例。 难度是指测验项目的难易程度,试题的难度可以用试题的通过率来表示。 * * 区分度是最大限度地区分所测量的被试的特性和能力的指标,它表明测验的辨别力的水平高低。(因此区分度又称题目的鉴别度。) 国外标准化测题的优秀题目的区分度一般在0.4以上。若区分度在0.29以下就要改进或淘汰。 (四)区分度 * 通常用D表示,取值范围为+1.00~1.00。 D越高则质量越好。 0.2以下应淘汰 0.2-0.3 合格 0.3-0.4 良好 0.4-1 性能佳 * 补充 练习: A. 称名数据 B. 顺序数据 C. 等距数据 D. 等比数据 性别、颜色分类、人口数、学校数; 身高、体重; 温度、各种能力分数、智商; 学生等级评定、喜爱程度、品质等级、能力等级、兴趣等。 * * 第三节 教育测量的类型与方法 * (一)根据测量对象分类:个别测量、团体测量 1.个别测量 测验的对象为个人,每次测验以一个受试者为对象,即一个主试者同时只能测试一个被试。 个别测量的可靠性比较高,主试能有效地观察控制被试的行为反应,但个别测量费时费力,短时间内难以获得大量的资料,并且对主试的要求较高。 2.团体测量 指在同一时间内主试能测试被试。 团体测量节省人力与时间,在短时间内能收集到大量的资料,效率较高,但被试的反应不容易控制,并且测量效果不及个别测量可靠。 * (二)根据测验所使用的的材料分类:语文测验、非语文测验或作业测验 1.语文测验 指一种使用语言或文字的测验,由主试用语言或文字说明做法,被试用语言或文字回答问题,团体测验多采用此形式。 2.非语文测验或作业测验 这类测验题目采用图画、符号、工具、模型等作为测验材料。 * (三)根据测验的参照系分为:常模参照测验、目标参照测验。 1.常模参照测验 常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩与同类对象在同一测验上的平均分(常模)相比较,从而解释分数,确定被试在总体中的相对位置的测验方法。 常模参照测验要有常模对照表。常模有地区性常模和全国性常模,地区性常模只适用于特定的区域,如在城市获得的常模就不一定适用于农村或边远地区,而全国性常模适用于全国所有的同类个体。如,儿童的身高、体重就有全国性常模,中国儿童发展量表(3-6岁)就有全国性常模。只要我们将个体实际测量数据与常模一对照,就可以知道个体所处的地位。 * * 2.标准参照测验 又称目标参照测验,是衡量被试实际水平的测验,将被试在测验上的分数与事先制定好的某种标准进行比较,看被试是否达到了目标规定的要求。 目标参照测验的特点是依据标准,判断被试的达标程度,而不是将被试的成绩与他人成绩做比较。如,英语水平测试、毕业考试、动作技能测试、体育达标测试等。 * (四)根据测量的性质分类:智力测验、能力倾向测验、成就测验等。 1.智力测验 智力测验是根据被试者对试题或作业的反应来测定其智力的高低。个别智力测验是主试者每次只测验一个被试,测验时能使被试注意力集中,也能仔细观察被试的反应。 测被试的智力高低,其结果常以智商(IQ)来表示,此类测验比较多,其中比较著名的有:斯坦福——比纳智力测验、韦克斯勒儿童智力测验量表(WISC-CR)、瑞文推理测验等。 * 第十一章 教育测量法 第一节 教

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档