英语专业四级考试阅读理解部分分支的研究.docxVIP

英语专业四级考试阅读理解部分分支的研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
英语专业四级考试阅读理解部分分支的研究 1 总结 英语三级考试(tem4)是根据英语课程和四级考试结构对英语课程学生进行标准化培训的。 2 文献总结 目前,国内对于英语专业四级考试阅读理解部分的研究并不多见。唐美华 3 不同文本转换格式下的分词处理 本研究选取了2009-2019年英语专业四级考试真题阅读理解部分自建小型语料库,其中2009-2015年每年四篇文本,2016-2019年每年三篇文本,共计40个文本。首先将这40个PDF文件保存为DOC文件,接着把这些DOC文件分别保存为对应的纯文本TXT格式文件并分别命名,同时删除每篇阅读理解之后的题干和选项。使用文本整理器(Text Editor5.0)对转换格式后的纯文本进行清理,再使用分词软件Tokenizer进行分词处理,然后使用Ant Conc 3.4.1w对以上语料进行统计。结果见表1。 在语料库语言学中,类符(type)指词形相同的词,而形符(token)指词语的总量,即日常所说的“词”。类符/形符比(typetoken ratio,TTR,又称形次比或类形比)则指类符与形符的比值,可用来衡量文本中的词汇密度 4 国外媒体的使用 为了观察2009年至2019年英语专业四级考试阅读理解真题的语篇来源,我们分别使用谷歌和百度搜索引擎检索,部分语篇来源结果见表2。 上表显示大多数语篇来源于国内外主流期刊或报纸,有的选自文化或教育类网站,有的选自经典小说或现代作家作品。主流期刊比如《经济学人》(The Economist)、《时代周刊》(TIME)、《读者文摘》(Reader’s Digest)等,报纸类的有《华盛顿邮报》(The Washington Post)、《华尔街日报》(Wall Street Journal)、《印度快报》(The Indian Express)、《华盛顿新闻报》(Newsday)、《今日美国》(USA Today)、《中国日报》(China Daily);来自文化教育类网站的有英国文化协会(British Council)、普利策奖网站(The Pulitzer Prizes)、亲生子女计划(The Natural Child Project)等。语篇选自经典小说的有:英国著名小说家劳伦斯的《儿子与情人》(Sons And Lovers)、美国作家马克·吐温的《百万英镑》(The Million Pound Bank Note)、英国作家威廉·毛姆的《人性的枷锁》(Of Human Bondage)、美国女作家凯特·肖邦的《一小时的故事》(The Story of An Hour)等。来自现代小说的有威廉·拉斯博瑞的《绝望之病》(The Disease of Despair)、格林·罗斯的《失而复得》(Lost and Found)等。统计还发现,在编写试题时,有的篇章经过改编或删减,比如选自经典小说的某个章节,而有的文章没有经过任何改编或删减,直接使用原文,如2015年第四篇文章,“Attachment Parenting is Not...”。 以上统计信息提醒广大备考学生要经常阅读国内外主流媒体或网站上的文章,广泛阅读传统或现代经典小说,不能仅仅局限于教材上的篇章。以扩大知识面和阅读量,了解英美国家主流文化,积累词汇量,提升阅读速度。 5 名靠前的词汇筛选 词汇量大小直接影响阅读理解的速度和深度。为了观察阅读理解真题中出现的词汇,我们使用Ant Conc软件面板中的Word List功能生成本语料库词表并使用File菜单中的Save Output to Text File把本词表保存为纯文本格式,结果如图1。 从以上词表(1)可以看出,类符数总共4074个,形符数为20036个。但是频率最高排名靠前的词汇都是些常见的冠词、介词、代词、连词、be动词等。这些词对于英语专业学生来说都早已经掌握,并不是学生备考需要准备的单词。而且,我们还发现词表中的有些词如:am,is,are,was本来是be动词的不同形式,却被计做不同的单词,这样类符数就会变得很多。为了筛选考生需要的单词,我们采用以下两种方法:我们先从这个词表中选出学生已经掌握的常见词汇1793个制作一个停用词表。再在Tool Preferences选项中加载制作好的停用词表(stop list),以期过滤掉这些常见词汇,结果如下图所示。 在词表(2)中,常见词已经被过滤掉,类符和形符数大大减少,变为2281个。然而,词表中的有些词,如absorbing和absorbs是同一词汇的不同形式,为了把这类词汇合并成一个单词,我们在Tool Preferences功能中勾选Use lemma list file选项,将词形还原,生成词表(3),如图3所示。 从词表(3)可以看出类符数变为20

文档评论(0)

182****7741 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档