对外汉语教学的测试课件.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对外汉语教学的测试 教育测量与评价 教育测量也称考试、测试。考试的目的是要作评价,作判断。根据考试的用途、手段和评价标准,可以将考试作如下分类: (一)根据测试用途分类 ?? 成就测试,能力测试,能力倾向测试 1. 成就测试 也称成绩测试,测试目的在于测量学生在某个学习阶段学到了什么,包括: A)各学科的单科/综合测试。 B)教学阶段的安置、形成、诊断和总结性测试。 安置性测试的典型例子是摸底考试和分班考试。 形成性测试考察学生进步的情况,对阶段性教学内容掌握的情况。 诊断性测试是针对个体或个别教学内容掌握情况的考试,意在对个别学生或特定的教学内容掌握的情况作精确的了解。 总结性测试的典型例子是学期、学年考试、会考也属这一类型。 2. 能力测试 测验目的在于测量个体的不因外界环境的影响而轻易改变的、较稳定的、表现在认知能力方面的心理特质,比如观察力、记忆力、理解力、概括力、空间想象力、判断推理能力等等。 IQ的测试属于这类考试。 3.能力倾向测试 又称学习能力测验,它介于成就测验与能力测验之间,既测知识也测能力,目的在于测量学生的潜在学习能力及学术发展趋向。潜在能力指个体从未来教育或训练中最可能发展并受益的能力,一般分为两种: A)一般学习能力测试。 B)特殊能力倾向测试。 高考属这类考试。 根据评分者和评分方法分类 客观试题 由被试者从可供选择项中确定正确(最佳)或错误答案的题目。这类题目包括是非题、多选题、配对题等,这类题目答案唯一,评分不受主观因素影响,在条件许可的情况下,还可以用机器阅卷评分。有时我们也把介于主观性题目与客观性题目之间的限制性题目如简答题、填充题也归类于客观题,全部由客观性题目组成的测验称之为客观性测验。 主观试题 由考生以自己的答案来回答所提出的问题。考生在处理问题方式、回答内容的选择、回答内容的组织及答题重点等方面均有相当的自由。这类试题包括论述题、证明题、作文题等,因为这类题目的答案不唯一,评分易受主观性因素的影响,故称之为主观性题目。 评分受评阅人主观判断的影响。 根据评价标准分类 常模参照测试 标准参照测试 根据是否运用标准化方法分类 标准化测试 非标准化测试 标准化的含义 题目的标准化(客观试题) 指导语的标准化 施测过程的标准化 评分的标准化 解释的标准化 最重要的是分数解释的标准化 原始分==〉标准分 原始分数的误区 case 1 有老师对学生说,你上次数学测验的的成绩是78分,这一次测验只得了71分,你为什么退步了? ?Case 2 家长看到孩子成绩单上的数学测验成绩为82分,语文测验成绩为70分,父母们对此是如何评价的? Case 3 某学校负责人在学期结束时的总结会上对某学科教师说他的教学效果不好,其依据是该学期学生在此学科上的考试平均成绩低于其他学科。 标准分的意义: 该生与全体考生比较所处的位置 根据测试材料和形式分类 语言与文字测试 非语言与文字测试 ? 根据人数多寡分类 团体测试 个人测试 考察测试质量的几个测量学指标 难度、区分度、效度、信度 1.难度 难度:被试完成题目(item)任务时所遇到的困难程度。 难度系数:定量地刻画被试作答题目时困难程度的量值。P ? 难度 1、难度的两种数学定义: (1)P=1—x/w??? x为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。 (2)P=x/w??? 这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。 区分度 区分度计算 信度 效度 一、信度 (一)信度的概念 信度是指测量结果的稳定性或可靠的程度,亦即测量结果是否真实、客观的反映实际水平。可以从以下三个方面理解测量的信度: 1、实测值与真值相差的程度 也就是误差,误差越小,测量的信度越高。 2、统计量与参数之间的接近程度 统计量指样本上的数字特征。参数是总体上的数字特征。 3.信度 信度指的是测量结果的稳定性和可靠性。也就是说,在不同时间、不同测验条件下所得分数之间能够保持一致。 重测信度 同一测验对同组被试先后两次施测所得结果的一致性程度。 复本信度 指同一批考生在两个平行(等值)试卷上得分的相关系数。 评分者信度 指评分者评分的稳定性和可靠性,反映了评分能够稳定地反映考生的真实知识和能力水平的程度。 4.效度 效度,就是指试卷的有效性,即试卷是否达到了考试的目的。换句话说,也就是测验是否精确地测量了想要测的东西。 效度的统计学定义是:与测量目标有关的真实分数方差与总分方差的比率 效度的分类 内容效度 题目对欲测的内容范围取样的适当程度。 构想效度(理论效度、结构效度、建构效度) 效标关联效度(准则效度、实证效度) 提高测验

文档评论(0)

xiexie2012 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档