网络双评过程中作文评分误差以及评分者效应的分析-未来教育高精尖.PDFVIP

下载本文档

37
0
约2.77万字
约 10页
2017-11-15 发布于天津
举报
版权申诉

网络双评过程中作文评分误差以及评分者效应的分析-未来教育高精尖.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

网络双评过程中作文评分误差以及评分者效应的分析-未来教育高精尖

2015年第2期网络双评过程中作文评分误差以及评分者效应的分析 ——以大规模英语考试作文评分为例李美娟刘红云摘要：目前大规模考试作文评分大都采用双评评分模式，本研究采用多侧面Rasch模型（MFRM）分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2427篇作文分析发现：①评分者的宽严度存在显著的差异；②在作文评分中，约有22.8%的评分者之间的一致性较差，也存在约3.5%的评分者之间一致性过高；③约90%的评分者自身的一致性都较高，但仍有8.8%的评分者自身一致性很差，约2%的评分者出现评分自身一致性过高的情况；④从整体上讲，评分者在不同的评分标准（或维度）上、不同评分等级宽严程度的把握存在差异；评分者和被试，以及评分者、被试和评分标准三者的交互作用不显著；⑤评分者对男生和女生具有相同的宽严度。关键词：主观题评分；多侧面Rasch模型；评分者误差分析【中图分类号】G405 【文献标识码】A 【文章编号】1005-8427(2015)02-0039-10 [2][3] 分的系统变异。换句话讲，评分者效应与评定量 1 问题提出尺的结构无关，与被试的能力无关，但却会影响评 1.1 英语写作评分概述 [4] 定的效度。主观题是大型考试必不可少的题型，其可以测以表现性为基础的语言评价已经越来越引起量被试对某个概念的理解、掌握以及应用概念解决研究者们的注意，这种考试要求被试在现实生活中 [1] [5] 问题的过程，而不是简单的再认或者猜测，但被试使用学到的知识和技能，不论是GRE，TOEFL，还在主观题上的得分往往通过评分者依据既定的标是国内四六级英语考试，或者初高中或者大学的升准进行评定，由于每个评分者不同的个性特点可能学考试，作文题是考查学生写作能力高低普遍采用会使得评分存在误差，从而影响考试结果的客观和的题型，但是评分过程必然会出现评分者效应。被公平。这种现象也就是所谓的评分者效应（Rater 试在特定写作任务的获得高分的概率不仅决定于 Effect）。评分者效应，如评分的准确性（Accuracy／被试的写作能力，而且可能受以下几个因素的影响 Inaccuracy）、严厉度（Harshness／Leniency）和集中 ①写作任务的特征；②评分者的个人特质；③评分度（Centrality／Extremism）常常被认为是评分者评时的特定情境；④学生的背景特征以及对写作任务本文为北京市教育科学“十二五”规划2012年度青年专项课题“学业水平测验认知诊断功能的应用研究”（CHA12109）成果之一。 [作者简介] 李美娟，女，北京教育科学研究院，助理研究员（北京 100191）刘红云，女，北京师范大学，教授（北京 100875） ChinaExaminations 39 测量与评价或者问题的兴趣；⑤不同影响因素的交互作用。这将各种误差的变异最小化。但是GT对原始分数进些因素引起的评分变异就是评分者效应，所以有很