两种评分量表的评分效应比较研究.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
两种评分量表的评分效应比较研究.PDF

教育研究与实验 2011 年第4 期 两种评分量表的评分效应比较研究 关丹丹 陈 睿 张 开 赵静宇 [摘 要] 本研究运用多面R asch模型对比分析了大、小两种评分量表下评分员的评分效应。结果 显示,与小尺度评分量表相比,评分员在大尺度评分量表下不能使用全距分值,容易给出趋中分数; 而且,在大尺度评分量表下评分员间的评分一致性较差。据此,提出应改进我国各项考试中写作评分 量表的设置,并单独报告写作成绩的建议。 [关键词] 写作评分 评分误差 多面R asch 模型 评分量表 英语、全国英语等级考试、大学英语四、六级考试 一、引言 等。上述采用综合评分法的测试项目中,按照分值 写作评分的研究一直是语言测试研究体系中的 设置的大小可以分为两大阵营(如表1 所示),其中 重要组成部分。 目前,国内外通行的写作评分方法 美、英、德、澳等国测试项目写作部分的分值均在 有综合评分法和分项评分法两种。综合评分法是按 10 分以下,1 个分数段为 1 分,且报告分数独立于 照等级(或称分数段)设定文章在内容、结构和语 总分;与之比较,中国的语言类考试,不论是汉语 言等方面的要求,评分者依据这些要求对文章形成 还是外国语,写作部分的分值均较大,且都计入总 总体印象,并据此给出分数。分项评分法是分项设 分。在中国知网(中国学术期刊全文数据库,网址 定每个等级的分数和要求,评分者依据分项要求, 为)键入“写作评分”或“作文评分”检索 先给出分项分,再将分项分相加得到写作总分,如 到的论文或文章有131 篇,这其中有关于整体评分 我国高考语文科试卷的写作部分是按照内容、表达、 [1]P200~202 和分项评分的对比研究(刘倩娣,张凤英2010 ; 特征三项分别给分,每项的满分是20 分,每项按照 [2] 洪佳敏2010 ),有关于写作评分误差的概化理论或 4 个分数段设定的要求评定分数。 目前,国内外涉 多面Rasch 模型研究(Engelhard 1992 ;[3]P171~191 刘远 及写作的大规模考试中,采用综合评分法的较多, [4]P211~218 [5]P26~31 我,张厚粲 1998; 谭智2008 ; 刘红云等 如美国的 SAT、 The ACT、 GMAT、 GRE General、 [6]P925~927 2010 )等,尚未发现对前述所及国外写作小尺 TOEFL 等,英国的IELTS、KET、PET、FCE 、CAE、 度评分(或称小评分量表)与国内写作大尺度评分 CPE 等,德国的TestDaF 等,澳大利亚的ICAS Writ- (或称大评分量表)的对比研究。国外的测试项目为 ing 等,以及我国的高考英语、硕士研究生入学考试 何选择小评分量表?评分量表的大小会影响评分的 本研究为全国教育科学规划教育部重点课题 “在硕士研究生入学考试中设置一般能力测试的研究” (课题批准号: GFA097020)研究成果之一。 92 宽严程度和趋中评分

文档评论(0)

sunyangbill + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档