两种教育测量理论在试卷质量控制和评价中的应用及其展望.docVIP

下载本文档

6
0
约8.8千字
约 20页
2019-09-15 发布于湖北
举报
版权申诉

两种教育测量理论在试卷质量控制和评价中的应用及其展望.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

两种教育测量理论在试卷质量控制和评价中的应用及其展望第期总第期南京医科大学学报社会科学版年月两种教育测量理论在试卷质量控制和评价中的应用及其展望钟轶.季晓辉 .南京医科大学公共卫生学院,.党委组织部,江苏南京摘要:研究归纳了经典测量理论与项目反应理论的异同.通过文献检索的方法阐明项目反应理论在国外教育机构已得到普遍运用.而国内医学院校的试卷质量控制和题库建设还停留在经典测量理论阶段.需要指导理论和方法的革新。关键词:教育测量:经典测量理论:项目反应理论中图分类号:. 文献标志码: 文章编号:??? :./ 现代教育测量的理论与技术产生于工业革命后教育测量是评价教育结果的重要路径之一.而考试又是教育测量的重要方法之一。教育测量不仅的一些西方国家.从世纪初叶开始获得迅速发仅是对考试结果的评价分析.也包括了对试题试卷展。世纪年代以后经典测验理论趋于成熟并质量的评价分析。随着各种考试深入到社会生活的稳步发展.得到广泛应用,在相当长的一段时期里成各个领域.试卷质量成为现代考试组织管理者需要为指导教育测量的主流方法和核心理论。世纪关心的核心问题。既要保证考试对所有应试者公平、年代以后出现了和概化理论公正.又要能较好地考核应试者的能力.以利选拔人 .简称,并逐渐打破了的一统天下, 引起了该领域的深刻变革并影响至今。在当今西方才。这就需要使考试的各个项目参数保持在一个相对稳定的层面上。教育测量学理论为如何获得项目国家.指导下的教育测量学理论与方法得到迅参数.如何运用参数进行长效管理提供了理论依据。速发展与广泛应用.在许多方面已呈现逐步取代目前人们主要利用两种测量理论??经典测验理论的态势。 .简称和项目反应理论二、两种教育测量理论的概念、特点及其应用 .简称来进行试卷质量控制和评价。考试管理者需要对这两种理论进行深入一 .简介及优缺点分析的了解并熟练掌握.才能对每一次考试形成正确的是基于..的“凡客观存在的评价。事物都有其数量”和..的“凡有数量的一、教育测量的定义及其历史发展东西都可以测量”这一可测性假设提出的。其基本思教育测量是依据一定的教育学理论.使用测验想是把测验的得分通常称为测验的观察分看作对人的教育成绩进行定量描述的过程。世界上最真分数反映被试者和误差分数的线性组合,其数早的教育测量出现于中国西周奴隶制时期公元前学模型表示为:。其中是观测分数,是年~公元前年。隋炀帝大业二年公元真分数.是随机误差。年. 根年出现的科举制在中国延续了年。其问据这一模型.引申出个相关联的假设公理:①若创造的分科考试、“弥封”、复评等方法,在我国早期一个人的某种心理特质可以用平行的测验反复测量教育测量方面产生了较大的影响。足够多次,则其观察分数的平均值会接近于真分数。收稿日期:?? 作者简介:钟轶一,男,江苏常州人,南京医科大学公共卫生学院学员,研究方向为高等医学教育与考试管理。万方数据第期总第期南京医科大学学报社会科学版年月②真分数和误差分数之间的相关为零。③各平行点与基于弱假设有关.在其理论体系内部很难测验上的误差分数之间相关为零。得到解决。 .在国内外教育测量中的应用情况对于利用,进行分析的测试而言.一旦测试结束,即可利用测试结果进行分析。其中重要的参目前国外已很少单独采用、进行测量数据数指标为信度、效度、难度分析和评价.多为和联合使用。和和区分度。信度用以衡量利用和从社测验结果是否反映了被测者的稳定的、一贯性的真会参与和学术参与两个维度对加州大学实特征。在丌中被定义为一组测量分数的真分数份“你的大学第一年”调查数据进行了分析.指出相比较.不但在测量精度方面能提供更的方差变异数在总方差总变异数中所占的比为丰富的信息.而且在质量改善上能提供更明确的率。实际运用中是计算反映试卷内在一致性的 ’值.如大于..可认为信度较高。效度路线图?。与国外相比.在国内的影响和应用还处于即有效性.是指测量工具或手段能够准确测出所需测量的事物的程度.测量结果与要考察的刚刚起步阶段。由于对了解不够.目前国内医内容越吻合,则效度越高;反之,则效度越低。对学院校更倾向于使用对医学生在校期间的医效度问题提出了诸多解决方案.美国心理学会在学课程考试情况和试卷质量进行分析和归纳整理。年将测量的效度分为三大类.即内容效度自年以来主要有:首都医科大学燕京医学院分、结构效度和效别对三年制卫生信息管理专业手术分类学期末考试标关联效度 .以检测知识试卷,:和七年制临床医学专业组织学与胚胎学期为主的考试较容易获得较高的内容效度. 末试卷进行质量分析::重庆医科大学