- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
两种教育测量理论在试卷质量控制和评价中的应用及其展望
第期总第期
南京医科大学学报社会科学版 年月两种教育测量理论在试卷
质量控制和评价中的应用及其展望
钟轶.季晓辉
.南京医科大学公共卫生学院,.党委组织部,江苏南京
摘要:研究归纳了经典测量理论与项目反应理论的异同.通过文献检索的方法阐明项目反应
理论在国外教育机构已得到普遍运用.而国内医学院校的试卷质量控制和题库建设还停留在经典
测量理论阶段.需要指导理论和方法的革新。
关键词:教育测量:经典测量理论:项目反应理论
中图分类号:. 文献标志码: 文章编号:???
:./
现代教育测量的理论与技术产生于工业革命后
教育测量是评价教育结果的重要路径之一.而
考试又是教育测量的重要方法之一。教育测量不仅 的一些西方国家.从世纪初叶开始获得迅速发
仅是对考试结果的评价分析.也包括了对试题试卷 展。世纪年代以后经典测验理论趋于成熟并
质量的评价分析。随着各种考试深入到社会生活的 稳步发展.得到广泛应用,在相当长的一段时期里成
各个领域.试卷质量成为现代考试组织管理者需要 为指导教育测量的主流方法和核心理论。世纪
关心的核心问题。既要保证考试对所有应试者公平、
年代以后出现了和概化理论
公正.又要能较好地考核应试者的能力.以利选拔人
.简称,并逐渐打破了的一统天下,
引起了该领域的深刻变革并影响至今。在当今西方
才。这就需要使考试的各个项目参数保持在一个相
对稳定的层面上。教育测量学理论为如何获得项目 国家.指导下的教育测量学理论与方法得到迅
参数.如何运用参数进行长效管理提供了理论依据。 速发展与广泛应用.在许多方面已呈现逐步取代
目前人们主要利用两种测量理论??经典测验理论 的态势。
.简称和项目反应理论
二、两种教育测量理论的概念、特点及其应用
.简称来进行试卷质量控
制和评价。考试管理者需要对这两种理论进行深入 一
.简介及优缺点分析
的了解并熟练掌握.才能对每一次考试形成正确的
是基于..的“凡客观存在的
评价。
事物都有其数量”和..的“凡有数量的
一、教育测量的定义及其历史发展
东西都可以测量”这一可测性假设提出的。其基本思
教育测量是依据一定的教育学理论.使用测验 想是把测验的得分通常称为测验的观察分看作
对人的教育成绩进行定量描述的过程。世界上最 真分数反映被试者和误差分数的线性组合,其数
早的教育测量出现于中国西周奴隶制时期公元前 学模型表示为:。其中是观测分数,是
年~公元前年。隋炀帝大业二年公元 真分数.是随机误差。年. 根
年出现的科举制在中国延续了 年。其问 据这一模型.引申出个相关联的假设公理:①若
创造的分科考试、“弥封”、复评等方法,在我国早期 一个人的某种心理特质可以用平行的测验反复测量
教育测量方面产生了较大的影响。
足够多次,则其观察分数的平均值会接近于真分数。
收稿日期:??
作者简介:钟轶一,男,江苏常州人,南京医科大学公共卫生学院学员,研究方向为高等医学教育与考试管理。
万方数据第期总第期
南京医科大学学报社会科学版
年月②真分数和误差分数之间的相关为零。③各平行 点与基于弱假设有关.在其理论体系内部很难
测验上的误差分数之间相关为零。
得到解决。
.在国内外教育测量中的应用情况
对于利用,进行分析的测试而言.一旦测试
结束,即可利用测试结果进行分析。其中重要的参 目前国外已很少单独采用、进行测量数据
数指标为信度、效度、难度 分析和评价.多为和联合使用。
和
和区分度。信度用以衡量 利用和从社
测验结果是否反映了被测者的稳定的、一贯性的真 会参与和学术参与两个维度对加州大学
实特征。在丌中被定义为一组测量分数的真分数 份“你的大学第一年”调查数据进行了分析.指
出相比较.不但在测量精度方面能提供更
的方差变异数在总方差总变异数中所占的比
为丰富的信息.而且在质量改善上能提供更明确的
率。实际运用中是计算反映试卷内在一致性的
’值.如大于..可认为信度较高。效度 路线图?。
与国外相比.在国内的影响和应用还处于
即有效性.是指测量工具或手段能够准确
测出所需测量的事物的程度.测量结果与要考察的 刚刚起步阶段。由于对了解不够.目前国内医
内容越吻合,则效度越高;反之,则效度越低。对 学院校更倾向于使用对医学生在校期间的医
效度问题提出了诸多解决方案.美国心理学会在 学课程考试情况和试卷质量进行分析和归纳整理。
年将测量的效度分为三大类.即内容效度
自年以来主要有:首都医科大学燕京医学院分
、结构效度 和效 别对三年制卫生信息管理专业手术分类学期末考试
标关联效度 .以检测知识 试卷,:和七年制临床医学专业组织学与胚胎学期
为主的考试较容易获得较高的内容效度.
末试卷进行质量分析::重庆医科大学
原创力文档


文档评论(0)