- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络双评过程中作文评分误差以及评分者效应的分析-未来教育高精尖
2015年第2期
网络双评过程中作文评分误差
以及评分者效应的分析
——以大规模英语考试作文评分为例
李美娟 刘红云
摘要:目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析
双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2427篇作
文分析发现:①评分者的宽严度存在显著的差异;②在作文评分中,约有22.8%的评分者之间的一致性较
差,也存在约3.5%的评分者之间一致性过高;③约90%的评分者自身的一致性都较高,但仍有8.8%的评分
者自身一致性很差,约2%的评分者出现评分自身一致性过高的情况;④从整体上讲,评分者在不同的评分
标准(或维度)上、不同评分等级宽严程度的把握存在差异;评分者和被试,以及评分者、被试和评分标准三
者的交互作用不显著;⑤评分者对男生和女生具有相同的宽严度。
关键词:主观题评分;多侧面Rasch模型;评分者误差分析
【中图分类号】G405 【文献标识码】A 【文章编号】1005-8427(2015)02-0039-10
[2][3]
分的系统变异 。换句话讲,评分者效应与评定量
1 问题提出
尺的结构无关,与被试的能力无关,但却会影响评
1.1 英语写作评分概述 [4]
定的效度 。
主观题是大型考试必不可少的题型,其可以测 以表现性为基础的语言评价已经越来越引起
量被试对某个概念的理解、掌握以及应用概念解决 研究者们的注意,这种考试要求被试在现实生活中
[1] [5]
问题的过程,而不是简单的再认或者猜测 ,但被试 使用学到的知识和技能 ,不论是GRE,TOEFL,还
在主观题上的得分往往通过评分者依据既定的标 是国内四六级英语考试,或者初高中或者大学的升
准进行评定,由于每个评分者不同的个性特点可能 学考试,作文题是考查学生写作能力高低普遍采用
会使得评分存在误差,从而影响考试结果的客观和 的题型,但是评分过程必然会出现评分者效应。被
公平。这种现象也就是所谓的评分者效应(Rater 试在特定写作任务的获得高分的概率不仅决定于
Effect)。评分者效应,如评分的准确性(Accuracy/ 被试的写作能力,而且可能受以下几个因素的影响
Inaccuracy)、严厉度(Harshness/Leniency)和集中 ①写作任务的特征;②评分者的个人特质;③评分
度(Centrality/Extremism)常常被认为是评分者评 时的特定情境;④学生的背景特征以及对写作任务
本文为北京市教育科学“十二五”规划2012年度青年专项课题“学业水平测验认知诊断功能的应用研究”(CHA12109)
成果之一。
[作者简介] 李美娟,女,北京教育科学研究院,助理研究员(北京 100191)
刘红云,女,北京师范大学,教授(北京 100875)
ChinaExaminations 39
测量与评价
或者问题的兴趣;⑤不同影响因素的交互作用。这 将各种误差的变异最小化。但是GT对原始分数进
些因素引起的评分变异就是评分者效应,所以有很
文档评论(0)