大学英语入学分级考试量化研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大学英语入学分级考试量化研究

大学英语入学分级考试量化研究   摘 要:教育部2007年修订的《大学英语课程教学要求》明确指出大学英语教学应贯彻分类指导、因材施教的原则,以适应个性化教学的实际需要。由于我国幅员辽阔,各地教育教学发展状况不一,学生英语水平也参差不齐,个性差异巨大,因而许多高校都实施了大学英语分级教学,并按照不同方式进行分班教学。然而针对分级试题质量方面的研究寥寥无几,本文拟以上海理工大学2012年大学英语入学分级考试为例,对大学英语入学分级考试进行量化分析。 关键词:大学英语 分级考试 量化分析 ★基金项目:本文为上海市研究生创新基金项目“建构主义视角下中国理工科大学生自主学习能力研究”(JWCXSL1302)、2013年度上海市教委重点课程建设项目“理工类学术英语读写”和上海理工大学人文重点项目“交互式大学英语自主学习模式构建及应用研究”(12XSZ04)之阶段性研究成果 一、引言 近年来,大学英语教学的质量备受关注。学生的英语水平不一,差别较大,一直以来是很多人比较苦恼的问题。根据《大学英语课程教学要求》提出的“分类指导、因材施教”原则,很多大学纷纷根据学生的英语水平实行分层教学。然而在分级试题质量方面的研究寥寥无几,本文以上海理工大学2012年大学英语分级考试试卷为例,对大学英语入学分级考试的试卷质量进行量化分析,旨在对试卷进行客观、准确、定量的分析和评价,使考试能更有效地检验学生的学习水平,使分级更加科学合理,为建立分级试题库做铺垫。 二、研究基础 就分级考试研究现状来说,国外针对英语作为外语或第二语言学习者(EFL,ESL)的分级考试的研究起步较早,硕果累累。Wall 等人(1994)研究了用于判断学术英语环境中受试语言能力弱点的大学英语分班考试并指出效度研究中较大的难题就是进行同期效度检验。也有学者(Fulcher 1997)对英语分级考试信度和效度进行了校验。除此之外,还有学者(如Green Weir)基于项目反应理论和因子分析法,研究了英语分级考试,并质疑了语法测试对教学的反拨作用。国内学者对分级考试的研究起步较晚,而且研究方法主要以理论综述和试卷结构描述分析为主(如:王瑞,2006;彭家海,2007;刘立,2009),并没有对分级考试试题的质量进行定量化分析。 三、结果与讨论 (一)描述性统计 通过数据统计,试卷的平均分为39.6092,说明整体得分较低;标准差为18.63556,说明分级试卷分数上下分值波动非常大。另外,倾斜度为0.065,大于0,呈正偏态,这个数值表明很多分数都低于平均值,因此分级试卷难度较大。除此之外,峰值为-1.256,小于0,说明曲线比较平坦,从另一角度说明分数上下差异很大,符合分级考试的目的,挑选优差生,可以根据考生的实际英语水平把他们编入不同班级学习。由于倾斜度和峰值在-2至+2之间,表明本次分级考试分数呈正态分布,可以进行下一步数据分析。 (二)信度分析 信度是对整个测量优劣的评价指标, 它揭示测量值与真值的相差程度, 反映样本与总体的接近程度, 从理论上讲, 信度越高, 测量结果越可信。Lado(1961)认为,若一个测试既包括主观题又包括客观题,它的信度系数应高于0.7。根据SPSS信度检验,该试卷信度系数(Cronbach ?)为0.825,表明该试卷得分可信。 (三)效度分析 效度(胡中锋,李方,2000)指测量结果的准确性和有效性的程度, 亦即测量是否达到预期的目的。效度的估计有多种方法, 常分为三大类: 内容效度、效标关联效度和构念效度。由于本论文是关于分级考试试题的定量分析,笔者重点分析了构念效度。 1.各部分之间的相关 Alderson等(1995)认为,测试中之所以设计不同项目是因为他们能够考核不同的能力,因此我们预期的相关也比较低,可能在0.3-0.5之间。从数据分析看出,听力、写作、阅读理解、词汇、完型、阅读和试卷总体的相关度分别是0.935、0.750、0.687、0.874、0.842 和0.860(在0.01水平上相关)。除了完型和听力、翻译与听力、完型与翻译的相关度在0.7左右之外,试题其他各个部分的相关度均在0.5左右(在0.01水平上相关),在合理的范围内。因此,此次分级测试的效度整体上是可以保证的。 2.各部分与总分相关 通过数据分析可知,每一部分与总分的相关都在0.01水平上显著。“根据经典测量理论,子项目与总分的相关可能被期望达到0.7或者更高,因为总分是对语言能力的综合测量”(Alderson等, 1995:184)。根据这个标准,每一部分与总分的相关度都符合理论要求,其中听力与总体相关度最高,高达(0.934)。 3.难度与区分度分析

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档