测验质量的评价.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
测验质量的评价

测 验 质 量 的 评 价 温州市教育教学研究院 邵晓明 什么是效度? 什么是信度? 什么是难度? 什么是区分度? 什么是算术平均数(X)? 什么是标准差? 什么是标准分数? 效度: 效度是指一个测验或测量工具能真实地测量出所要测量的事物的程度。一次测验是否有效,主要看其是否准确测量了它所要测量的东西。 内容效度: 测验的内容效度是指它从需要测验的教材中提取样本的适当程度。内容效度的高低,取决于测验题目的代表性,要看选出的题目能否包含所测内容范围的主要方面,并使各方面题目比例适当。 构想效度: 测验的构想效度是指一个测验能够测量理论上的构想或内在心理特性的程度。例如,某智力测验测得的结果,如果与该测验所依据的智力理论关于智力的一些假设相符,那么这个智力测验就具有构想效度。构想效度对心理测量来说意义重大,但对于成绩测验来说则无关紧要。 预测效度: 测验的预测效度指一个测验能够预测学生将来某种特定行为或表现的程度。预测得越准,效度就越高。例如,用入学考试预测学生入学后的学习成绩,用职业测验预测工作能力等。 信度: 信度是表明评价工具质量的又一重要指标,它主要指测验结果的前后一致性程度。例如,如果一个学生多次参加某种测验都得到相近的分数,那么就可以认为该测验稳定可靠,信度是较高的。 再测信度: 用同一种测验在不同时间里两次测验同一组学生,然后统计两次测试成绩的相关,求得的相关系数即为再测信度系数。信度系数的最大值为1,表示再测信度最高,最小值为0,表示再测信度最低。再测信度高,说明测验成绩稳定,反之,则测验不稳定,需修订。 分半信度: 将一个测验分为等质量的两半,求这对半分的两半测验所得分数的一致性程度,即为分半信度。分半信度是反映测验内在一致性的一个重要指标。求分半信度的基本方法是用一种测验对学生进行测试,在计算分数时把试题分为等质量的两半(通常以试题的奇数为一组,偶数为一组),分别计算总分,再以统计相关求得分半试卷成绩的相关系数,便为分半信度系数。 评分者信度: 把相同的测验结果提供给不同的评分者打分,若不同评分者给的分数大致相同,说明该测验有较高的信度。客观性测验评分标准客观、准确,评分者信度一般较高。非客观性测验要想提高信度,就应当尽可能使评分标准达到客观、准确。 难度: 难度指测验试题的难易程度,是表示测验试题对学生适宜程度的一个指标。 通常可用两种方法来计算试题难度。 一、用试题的答对率(通过率)计算难度。 P=答对人数(R)/被试总人数(N) P值越大,难度越低,P值越小,难度越高。一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。当然,在实际的评价过程中,测验的难度水平多高才合适,也还要取决于测验的目的。如果教师要对学生的知识准备状况进行一次诊断性测验,为了真实、准确地了解学生的知识掌握情况,测验难度大一点也是正常的。 二、用某题测试的平均分与该题满分之比计算难度 P=某题测试的平均分(X)/该题满分(X) 国家考试中心测试高考试题的难度就是采用此公式计算的。 一般说来,难度在0.25—0.75的试题是较适宜的。 区分度: 区分度有时也称鉴别力,它主要指测验对于不同水平的被试加以区分的能力。它反映着测验与被试实际水平的相符合程度,如果在某道题上得分高就意味着学生的实际水平高,得分低就意味着实际水平低,那么该测验就有较高的区分度。区分度与难度紧密相关,测验过难或过易,会造成被试都通不过或都通过的结果,这样,测验也就无鉴别力可言了。 XH、XL分别为高分组和低分组在该题得分的平均分数,Xm为该试题的满分。 一般取高分组和低分组人数为全体学生的百分之二十七,若人数较少,则可以是三分之一 这是国家考试中心计算高考区分度的方法—相点法。 P—该题得分超过该题平均分的考生占考生总数的百分比。q=1-p,Xp—该题得分超过该题平均分的考生的科目原始分的平均分, Xq—其余考生的科目的平均分,S—科目标准差。 算术平均数(X): 算术平均数是教学测验结果统计中应用最广泛的一种量数,它反映和描述分数集中趋势的统计量。它能代表事物的整体水平,能判明一组数据与另一组数据的差别,从而研究造成差别的原因,还可以用它来研究一个事物的整体水平随时间的变化。 ? 标准差: 标准差是表示离散程度的一个统计量。有时,两种分数分布集中趋势相同,而离散程度不同

文档评论(0)

zhuliyan1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档