朱正才英语能力等级量表描述语量表化的可行性方案探讨.docx

下载文档

7
0
约5.39千字
约 6页
2016-11-30 发布于重庆
举报
版权申诉
保障服务

朱正才英语能力等级量表描述语量表化的可行性方案探讨.docx

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

朱正才英语能力等级量表描述语量表化的可行性方案探讨

朱正才：英语能力等级量表描述语量表化的可行性方案探讨　作者：朱正才，上海交通大学教授，博士生导师。　原文刊载于《中国考试》2015年第4期。　摘要：本文在参照国内外语言量表研制经验基础上，结合我国的实际情况，提出中国英语能力等级量表描述语量表化的一个可行方案。对如何抽取学生语言行为样本、收集描述语和学生语言行为表现的匹配数据、设计带锚题的描述语调查问卷等提出解决方法，以期为国家外语能力测评体系建设提供智力支持。　关键词：外语能力测评体系；英语能力等级量表；描述语量表化　1 　引言　英语能力等级量表描述语量表化是英语能力等级量表研制的关键环节，直接关系到量表的科学性和可操作性。本文在主要参照《欧洲语言共同参考框架：学习、教学、评估》（CEFR）等世界著名语言能力量表研制和国内外众多语言能力标准制定经验的基础上，结合我国的实际情况，尝试对中国英语能力等级量表描述语的量表化提出一整套解决方案，以期为国家外语能力测评体系建设提供智力支持。　２　描述语的分类和能力等级确定　描述语量表化的基本程序是：第一步，描述语的撰写者、收集者或者改写者在讨论的基础上，凭经验确定描述语的分类和能力等级；第二步，对描述语广泛征集各方意见，进行问卷调查和调查数据的分析；第三步，综合调查数据的分析结果以及专家意见，最终确定每条描述语适合的类别以及能力等级。　2.1 抽取有代表性的学生语言行为样本　心理学的“能力连续统”（Continuum）假设认为，人的任何一种心理特质（包括语言能力），从总体上看，其分布都是连续的，从极端的无能到完美的熟练，呈现一种正态分布形态。中国英语学习者的英语能力也应该符合这个假设：从低端的、很有限的英语能力，到高端的专业翻译能力，中间是连续的正态分布。　描述语量表化的第一步需要有一个足够大的、有代表性的学生语言行为样本。如果能从中国英语学习者（或使用者）总体中抽取一个很大的样本，并且使用科学的抽样方法，那么，这个样本的代表性就会很高。这样，就有可能通过这个样本对中国英语学习者的英语能力表现进行全面而细致的描述验证。　首先，中国英语能力等级量表的适用对象主要是中国教育系统的英语学习者，故可以在中国各级各类学校中“分层随机”地抽取学生样本，其他英语教育系统和英语自学群体则只要抽取少量学生样本作为补充数据。不同层级的学生组成比例要符合两个原则：第一，在校学生数多的层级相应地要抽取更多的样本；第二，社会迫切需要描述其英语能力的学生层级也要抽取更多的样本，因为针对这部分群体相应的描述语也会更多。　如何确定合适的样本大小呢？这主要看项目的真实需要和可行性，两个方面要做一个平衡。假设需要数据验证的量表数目有100个,每个量表9个等级, 那么，将形成900个交叉描述语网格。如果每个网格最后平均需要2条描述语（这里参考了CEFR的经验，中国英语能力等级量表可以更多），则共需要1800条描述语。再假设数据验证过程要淘汰大约30%的描述语，那么，最终应该有2 500条左右描述语需要收集调查数据。接下来，将50条描述语组　成一份问卷（暂不考虑锚题），共产生50 份问卷。根据IRT多级评分模型，题目难度参数估计要求的一个比较低的样本容量是100人，按照这个最低要求每份问卷要调查100人，则至少需要5000名学生。这就是样本量的一个下限，实际执行时只能多不能少。　在抽取学生时要按照班级抽，好、中、差兼顾，比如一个市只抽3所学校，一定要好、中、差各一所；抽2所学校时，好、差各一所；抽一所学校时，抽中等的。在抽取班级时，同时要考虑英语任课教师，必须是连续2年以上负责该班教学的有责任心的教师，因为填写调查问卷的是教师。在抽取学生时，建议参考CEFR中North的做法，要求教师先将自己“熟悉的学生”（也可能来自不同班级）按平时英语成绩和课堂表现从高到低排序，然后再从中抽取10~20人（其中：差生1~2名，中下2~3名，中等3~4名，中上3~4名，最好学生2~3名）。不过，North发现这样做，得到的学生样本代表性也不是很好，因为不完全随机。但是，如果不做这样要求，教师就倾向于只抽好学生，样本代表性会更差。　2.2 收集描述语和学生语言行为表现的匹配数据　有了学生语言行为样本，接下来要做的是将描述语和语言行为“匹配”（Matching）在一起，也就是收集描述语和语言行为的匹配数据。目前，国际上主要有三种做法：教师评判法、学生自评法和专家评判法。　（1）教师评判法：就是由最了解学生的任课教师来评学生。教师了解所教学生的英语能力行为表现，能够比较准确地把描述语和每个学生的英语能力匹配起来。笔者认为，中国英语能力等级量表应该主要采用这一方法收集数据。　（2）学生自评法：由学生自己评自己。这一方法存在的问题是：第一，对于小学生，他们还没有“自我感知能力”