- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言能力的分级测试.doc
语言能力的分级测试
——大学英语四、六级考试设计中的量化分析
杨惠中
(作者简介:杨惠中,教授,博士生导师,上海交通大学,原全国大学英语四六级考试委员会主任,上海,200030。
关键词:语言能力; 定量分析; 定性分析; 分级测试
一、语言能力的量化分析
在现代语言测试中对语言能力进行分级测试有着重大的实践意义,因此引
二、语言能力的定量分析
1.词汇量:教学词表的制定
在讨论语言能力的量化分析时,人们首先想到的是确定词汇量。据统计,现50万个单词,在有限的学时内要掌握英语以满足实际的交际需要,20世纪40年代就有心今天有计算机辅助,完全可以把制定教学词表的工作做得更科学、更有效。
教学词表是教学大纲的组成部分,教学词表应包括定语域中最基本、最常用的词汇,因此,是从事语言教学、编写教材、进行语言测试的基础。
制定教学词表是一项严肃的科研工作,由于从事语言教学的教师背景不同、接触的语言材料不同,制定词表时不能凭经验,不能凭主观判断。为了摆脱选词中主观因素的影响,制定教学词表的原则应是定量分析为主,定性分析为辅,对进入词表的每一个单词仔细斟酌。
1)建立专用语料库
计算机为语言统计提供了强大的手段。所谓定量分析就是对语言材料进行统计分析,为此建立了专用语料库,即JD学术英语语料库。语料库是语言研究的强有力的工具。语言是一种海量现象,语言事实是一个不可穷尽的开放系统。语言研究不可能调查一切语言事实。统计学告诉我们,对于一个大数量的群体可以采用随机采样的方法进行研究,只要样本在三个方面满足采样条件,样本就能反映总体的基本统计特征,这时研究样本就近似于研究总体。这三个条件是:样本的代表性、采样的随机性、样本必须有足够大的量。根据大质,即“以英语为工具获取专业所需的信息”,决定JD学术英语语料库所采语料在性质上属学术英语(English for Academic Purposes)范畴,并保证文、理、工、医各科有一定的比例;语料库容量初建时为100万英语词,现已扩大到350万英语词,使统计结果具有一定的可靠性;另外,为了保证采样的随机性,决定每个语料单元为≥500英语词的连续的语篇,从随机抽取的英、美出版的书籍中按一定的规律随机采样;为使建成后的语料库能反映各种不同语体,还根据学生未语的需要确定语体的比例。JD学术英语语料库的结构和语体分布见表1和表2。表1JD学术英语语料库构成 文科~25% 教育学 语言学 历史学 社会学 文学理论 经济学
管理科学 理科~25% 物理 化学 地理学 心理学 生物学 天文学 工科~30% 计算机科学与应用 机械制造 铸造 电器工程 民用建筑 船舶工业 航空工业 原子能 电子工程 航天 通讯 焊接 地质 自动化 石油工业 生物医学~20% 环境科学 基础医学 预防医学 临床医学
表2JD学术英语语料库语体构成
JD 期刊 25%
教科书 25%
专著 l5%
论文 l0%
科普读物 l0%
文摘 5%
手册、书评、新闻报道等 10% 2)选词的统计学标准
选词的主要统计学指标是频率、率和分布率。
语料库中每个连续的字符串称为标型(token),语料库的容量指的就是标型型(type);类型经过削尾处理(lemmatization)就是单词,可见3。词的出现频率按语料的不同而不同,但当语料库容量足够大时,词的
表3JD学术英语语料库频率词表实样
篇章
分布率 专业
分布率 大类
分布率 选词指数 概率 the
of
be
and
a
in
to
that
for
as
have
with
by
this
it 274087
155584
15549l
98596
98558
86648
86478
34946
33713
2784l
27418
25865
25690
22118
21288 6314
6314
6314
6312
6315
6310
6310
6005
6125
5986
5860
5945
5934
5757
5533 32
32
32
32
32
32
32
32
32
3
原创力文档


文档评论(0)