- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析英语作文评分信度
浅析英语作文评分信度
摘 要:在语言测试中,评分信度指评分员对考生能力作出主观评价的一致性程度,可分为评判内信度和评判间信度;相关性计算是衡量评分信度的常用方法;影响英语作文评分信度的因素众多,统一评分标准及样卷,培训评分员等措施可提高作文评分信度。
关键词:评分信度 影响因素 提高措施
中图分类号:G642.3 文献标识码:A文章编号:1673-1875(2009)05-028-01
一、评分信度的概念及常用计算方法
效度(validity)与信度(reliability)是现代语言测试的两个核心要素。简言之,效度指一个测验能测出预定要测量的事物的程度;信度指一个测试的测量结果在多大程度上具有一致性, 如果一个考试在不同的情况下或对不同的人进行都得出同样的结果,那么就说这个考试是可靠的[1]。评分信度是指评分员对考生能力作出主观评价的一致性程度,特别是在评判口语与写作测试时,因为评分员的主观因素致使评分不一致的现象时有发生,可从以下两个方面分析:评判内信度(intra-rater reliability)和评判间信度(inter-rater reliability)。评判内信度是一个评分员两次或更多次对考生的能力所做的主观评定的一致性程度,例如,如果某一评分员在某一时间内对30份作文成绩进行了评分,以后的某个时间内对这30份作文再次进行评分,如果两次评分一致性较高,评分信度就较高。评判间信度是指不同评分员对考生的能力各自作出主观性评价的一致性程度,如果几个评分员使用同一测量语言水平各方面的等级量表来对考生评级,而名次高低大致相同,则该等级量表就可以认为具有高度的评判员间信度。
基于真分数理论的信度计算方法也适合于评分信度的计算[2],该理论认为:抽象的语言能力是无法精确得知的,只能根据考生的测试分数(observed score)即在某项语言测试中得到的成绩进行估测, 这个测试分数包括真分数(true score)和误差分数(error score)两部分, 真分数归因于考生的真实语言能力,误差分数(error score)归因于真实语言能力之外的其它因素。假如某些考生参加两个平行测试(parallel tests), 即设计衡量同样的技能或者能力的同一测试的两种形式,采用同样的测试方法,并且有同样的长度和难度,分别得到测试分数1和测试分数2,测试分数1包括真分数1和真分数1;测试分数2包括真分数1和误差分数2。对同一考生而言,归因于真实语言能力的真分数1和真分数2应该相等,而归因于真实语言能力之外的其它因素、随机的误差分数1和误差分数2的存在,使测试分数1和测试分数2不可能完全一致,在此情况下,误差分数1和误差分数2的值越小,测试分数1和测试分数2就越接近,越相关,反之,测试分数1和测试分数2越越接近,越相关,说明误差分数1和误差分数2的值越小,测试分数就越能反映真分数,测试的信度就越高,因此,平行测试的信度可以用两个测试分数的相关性表示。在衡量评分信度时,可以将评分员评定分数看做平行测试中的测试分数,也由反映考生某项语言能力的真实分数和因为评分员主观原因造成的误评分数组成,同样的推导过程可以得出:评分信度也可以用评分员评定的分数的相关性表示,例如,评分员甲和评分员乙对相同的30篇作文各自评分,两位评分员所评分数的相关性是0.80或者是更高,就表示评分信度较高。
二、影响英语作文评分信度的因素分析
任何有影响的大范围考试都必须包括产生性运用试题,因为这种试题有极好的反拨效应。在所有各种试题当
中,它们是唯一能带给教学纯粹正面的、最全面的反拨效应的试题,因而也是任何其他试题所不能取代的, 写作作为一种优良的主观题型,更是出现在几乎所有的现代语言测试中[3]。由于受到阅卷人的生理、心理稳定性、语言能力和水平等不自觉因素的影响,对应考者的书面表达能力的判断与测量往往过于主观,从而导致评分出现偏差,使写作测试分数的信度大大地降低。从实践中看,主要有以下几种情形:
对同一评分员而言,评判作文时的顺序可能影响评分信度,某一评分员在某一时间内对30分作文进行评分,在刚开始评判前几分作文时并没有太在意语法错误,而只是注重作文的内容与连贯方面,而在继续评阅下面的作文时,发现语法错误非常严重,此时评分员在无意识中会更多的把语法错误作为评分的依据,这样,排在前几份的作文即使语法错误与排在后面的作文一样严重,但得到的分数可能更高。有两个或两个评分员时情况更加复杂,例如分别有评分员甲、评分员乙给同样30篇作文打分,得到的结果可能大不相同,评分员甲可能只是依据语言质量评分,而评分员乙综合依据语言质量、内容、衔接与连贯各方面给分,即使要求两位评分员就
您可能关注的文档
最近下载
- 2025年专业工具通达信软件操作详解教材 .pdf VIP
- 沉降观测方案.docx VIP
- 《土地管理法》考试题库(含答案).docx VIP
- P12 更多的资料请参阅《2010学年上中CPS活动手册 上海中学.docx VIP
- 从肝论治2型糖尿病课件.doc VIP
- 于志强教授从肝论治糖尿病经验.docx VIP
- 2021届北京市海淀高三语文一模阅读部分讲评 课件(150张PPT).pptx
- 背负式风力灭火机的操作与使用 .ppt VIP
- 苏州七年级月考试卷及答案.doc VIP
- 山东科学技术版劳动实践指导手册三年级第11课公益劳动与志愿服务校园公益劳动清洁美化校园我行动 教案.docx VIP
文档评论(0)