两种教育测量理论在试卷质量控制和评价中的应用及其展望.docVIP

两种教育测量理论在试卷质量控制和评价中的应用及其展望.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
两种教育测量理论在试卷质量控制和评价中的应用及其展望 第期总第期 南京医科大学学报社会科学版 年月两种教育测量理论在试卷 质量控制和评价中的应用及其展望 钟轶.季晓辉 .南京医科大学公共卫生学院,.党委组织部,江苏南京 摘要:研究归纳了经典测量理论与项目反应理论的异同.通过文献检索的方法阐明项目反应 理论在国外教育机构已得到普遍运用.而国内医学院校的试卷质量控制和题库建设还停留在经典 测量理论阶段.需要指导理论和方法的革新。 关键词:教育测量:经典测量理论:项目反应理论 中图分类号:. 文献标志码: 文章编号:??? :./ 现代教育测量的理论与技术产生于工业革命后 教育测量是评价教育结果的重要路径之一.而 考试又是教育测量的重要方法之一。教育测量不仅 的一些西方国家.从世纪初叶开始获得迅速发 仅是对考试结果的评价分析.也包括了对试题试卷 展。世纪年代以后经典测验理论趋于成熟并 质量的评价分析。随着各种考试深入到社会生活的 稳步发展.得到广泛应用,在相当长的一段时期里成 各个领域.试卷质量成为现代考试组织管理者需要 为指导教育测量的主流方法和核心理论。世纪 关心的核心问题。既要保证考试对所有应试者公平、 年代以后出现了和概化理论 公正.又要能较好地考核应试者的能力.以利选拔人 .简称,并逐渐打破了的一统天下, 引起了该领域的深刻变革并影响至今。在当今西方 才。这就需要使考试的各个项目参数保持在一个相 对稳定的层面上。教育测量学理论为如何获得项目 国家.指导下的教育测量学理论与方法得到迅 参数.如何运用参数进行长效管理提供了理论依据。 速发展与广泛应用.在许多方面已呈现逐步取代 目前人们主要利用两种测量理论??经典测验理论 的态势。 .简称和项目反应理论 二、两种教育测量理论的概念、特点及其应用 .简称来进行试卷质量控 制和评价。考试管理者需要对这两种理论进行深入 一 .简介及优缺点分析 的了解并熟练掌握.才能对每一次考试形成正确的 是基于..的“凡客观存在的 评价。 事物都有其数量”和..的“凡有数量的 一、教育测量的定义及其历史发展 东西都可以测量”这一可测性假设提出的。其基本思 教育测量是依据一定的教育学理论.使用测验 想是把测验的得分通常称为测验的观察分看作 对人的教育成绩进行定量描述的过程。世界上最 真分数反映被试者和误差分数的线性组合,其数 早的教育测量出现于中国西周奴隶制时期公元前 学模型表示为:。其中是观测分数,是 年~公元前年。隋炀帝大业二年公元 真分数.是随机误差。年. 根 年出现的科举制在中国延续了 年。其问 据这一模型.引申出个相关联的假设公理:①若 创造的分科考试、“弥封”、复评等方法,在我国早期 一个人的某种心理特质可以用平行的测验反复测量 教育测量方面产生了较大的影响。 足够多次,则其观察分数的平均值会接近于真分数。 收稿日期:?? 作者简介:钟轶一,男,江苏常州人,南京医科大学公共卫生学院学员,研究方向为高等医学教育与考试管理。 万方数据第期总第期 南京医科大学学报社会科学版 年月②真分数和误差分数之间的相关为零。③各平行 点与基于弱假设有关.在其理论体系内部很难 测验上的误差分数之间相关为零。 得到解决。 .在国内外教育测量中的应用情况 对于利用,进行分析的测试而言.一旦测试 结束,即可利用测试结果进行分析。其中重要的参 目前国外已很少单独采用、进行测量数据 数指标为信度、效度、难度 分析和评价.多为和联合使用。 和 和区分度。信度用以衡量 利用和从社 测验结果是否反映了被测者的稳定的、一贯性的真 会参与和学术参与两个维度对加州大学 实特征。在丌中被定义为一组测量分数的真分数 份“你的大学第一年”调查数据进行了分析.指 出相比较.不但在测量精度方面能提供更 的方差变异数在总方差总变异数中所占的比 为丰富的信息.而且在质量改善上能提供更明确的 率。实际运用中是计算反映试卷内在一致性的 ’值.如大于..可认为信度较高。效度 路线图?。 与国外相比.在国内的影响和应用还处于 即有效性.是指测量工具或手段能够准确 测出所需测量的事物的程度.测量结果与要考察的 刚刚起步阶段。由于对了解不够.目前国内医 内容越吻合,则效度越高;反之,则效度越低。对 学院校更倾向于使用对医学生在校期间的医 效度问题提出了诸多解决方案.美国心理学会在 学课程考试情况和试卷质量进行分析和归纳整理。 年将测量的效度分为三大类.即内容效度 自年以来主要有:首都医科大学燕京医学院分 、结构效度 和效 别对三年制卫生信息管理专业手术分类学期末考试 标关联效度 .以检测知识 试卷,:和七年制临床医学专业组织学与胚胎学期 为主的考试较容易获得较高的内容效度. 末试卷进行质量分析::重庆医科大学

文档评论(0)

beoes + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档