测验质量的三维审视及对命题的诉求.pdfVIP

测验质量的三维审视及对命题的诉求.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
测验质量的三维审视及对命题的诉求.pdf

2011年第 2期 考试研究 No.2,2011 总第25期 EXAMINATIONSRESEARCH GeneralNo.25 测验质量的三维审视及对命题的诉求 张远增 [摘 要] 本文建立了评估测验质量的稳定性、自洽性和可推广性三个指标, 并运用它们对测验质量进行初步分析,在此基础上讨论了作为测验质量指标的稳定 -陧、自洽性和可推广性对命题的诉求及具体的实施策略与方法。 [关键词] 测验质量 ;稳定性;自洽性 ;可推广性 ;命题 [中图分类号] G424.74 [文献标识码] A [文章编号] 1673—1654 2011 02—047—007 从稳定性的界定可以发现,测验所预设 一 、 测验质量的三个维度 的各水平 总分 的得分模式②应该具有明显 的差异,如果不考虑被试参加测验之随机误 任何题 目的功能均是有限度的,好的测 差的影响,那么,对于试卷分数结构进行微 验是具有独特功能的题 目的 “配伍” 。题 目 调,其所产生的对被试所得的分数的影响应 “配伍”后所形成的功能系统的内在机制及 该是对高水平的被试有利——调整的结果不 整体功能释放途径决定了测验 的质量,稳定 会降低高水平被试的得分,而对低水平的被 性、自洽性及可推广性为人们把握测验质量 试不利——调整的结果不会增加低水平被试 提供 了现实的可能。 的得分 。如果出现与这种现象相反的结果, 一 稳定性 那么这样 的测验就不是一个好的测验。 所谓稳定性指测验结果对题 目分数结构 二 自洽性 依赖性的程度。稳定性表现为,测验所能考 所谓 自洽性指构成测验的题 目之间融洽 查的各个水平依据其实际得分由高到低所形 和谐、相互校正测验误差、考查功能互补的程 成的排名,不依赖测验的题 目分数结构。也 度。自洽性的表现为测验应该按照 “相生相 即对于好的测验而言,对于测验的题 目分数 克,相克相生”的原则配置 自己的题 目,形成 结构作微小的变动后,测验者基于相 同的题 一 个基于题 目功能多样性 的逻辑结构合理 、 目及新的分数结构所得出的分数,应该不会 题型结构合理的有机系统。 降低其在接受测验的总体中的排名。 自洽性表明,构成测验 的各个题 目均是 作者简介 张远增,博士,副教授 ,华东师范大学公共管理学院。上海,200062。 本文是 “教育评 价的质量控制研 究”课 题 2008年 度教 育部人 文社科规划基金 项 目。课题 编号: O8JA880o237 阶段性成果。 ① 配伍是中药学术语,指根据具体病情及药物性能,有选择地把两种或两种以上的药物结合在一起同时使用。 ② 得分模式指 同一认知水平 指相 同总分 的被试能够完整和部分解答的题 目按照题号 由小到大排成的序列。 -- - - — — 47 ----—— 《考试研究 2ol1年第2期 总第25期 以弥补其他题 目考查功能的限度作为存在前 能力和思想方法性 目标可以抽象到一般意义 提,而以自己具有独特 不可替代 的考查功 下该能力和思想方法,如考生运用函数方程 能立足。从测验设置的单个题 目看,自洽性 思想方法解具体问题可以抽象到考生具有函 要求测验之各构成题 目的内部要 自洽,不仅 数方程思想方法。 具有 自我校正测量误差的能力,而且要以自 可推广性既依赖单个题 目的可推广性, 己具有的独特考查功能作为测验设置其他题 也依赖题 目之间的相互作用所形成的基于题 目的理由。从测验 的题 目之间的关系看,自 目所直接考查内容的上位内容。仍以初中毕 洽性要求各题 目的考查指向一致,题 目之问 业生学业水平考试为例,其试卷 测验 的可 不相互排斥,各个题 目在 自身能充分发挥优 推广性就要求试卷所考查的知识点性 目标可 势功能的同时,不抑制其他题 目发挥优势 以抽象到相关课程标准的内容标准,试卷所 功能。 考查具体技能性 目标可以抽象到课程标准的 此外,自洽性还要求用联系的观点总体 技能标准,试卷所考查具体能力和思想方法 把握测验的误差,题 目的配置要能确保测验 目标可以抽象到课程标准的能力和思想方 的总体误差最小化,能确保 同一水平考试结 法,以及试卷的考查要求可 以推广到对课程 果成绩一致 。 标准总 目标 。 三 可推广性 可推广性好的试卷为把测验所使用的试 所谓可推广性指能将测验得出的直接结 卷视为等距量表提供 了依据,使得测验分数 果推广到更为一般结论的程度。①可推广性 具有可加性,为进一步采用定量方法分析测 要求测验能通过被试在有限知识、技能、思想 验结果奠定了基础。 方法及情感态度价值观等方面的反应,来把 握被试表现的多样性。好的测验除了直接给 二、稳定性对命题 的诉求 出的测验结果 以外,还为人们把握被试更为 一 般的信息提供了

文档评论(0)

39号书库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档