介绍分析英语文章难度一种方法.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
介绍分析英语文章难度一种方法

介绍分析英语文章难度的一种方法   摘 要: 英语文章的难度是存在等级的,而难度的划分有很多原则。本文基于词汇层次来区分文章的难度,如果文章中常用的词汇出现百分比多,文章就可能简单,反之,文章就有可能偏难。基于上述原则,利用软件来分析词汇等级,从而确定文章难度,旨在帮助学习者选择适合的材料进行学习。   关键词: 英语文章 难度 词汇等级      目前英语单词的词汇总量已经超过200万(汪榕培,1999),有专家估计,英语现每年至少以850个左右的新词的速度增加(王文斌,2005)。在英语学习过程当中,这样海量的单词,无疑是拦路虎。幸运的是,虽然英语有这么多的单词,但是它们在语篇中的作用不一样,据Francis和Kucera(1982)统计,在一百多万词的Brown语料库中,频率居前1000单词就可以覆盖72%的语料库;频率居前2000单词可以覆盖79.7%;频率居前3000单词可以覆盖84%;频率居前4000单词可以覆盖86.8%;频率居前5000单词可以覆盖88.7%;频率居前6000单词可以覆盖89.9%;频率居前15851个单词才覆盖97.8%。从上面的数据我们可以发现常用的单词(词频在前2000个单词)大约占语篇的80%,这样我们在学习英语过程中,首先掌握这两千个左右的单词,就可以基本了解一般文章的大意。反过来,我们根据这些单词的覆盖率也可以确定文章的难度,也就是说,如果一个文章含有常用的单词少,文章就越难,反之就容易。   日本早稻田大学的Anthony,Laurence教授根据上面的词控理论原则,编写了AntWordProfiler软件,不过他选择的单词不是上面统计出来的单词,他使用的是West(1953)的General Service List和Coxhead(2000)的Academic Word List,前者有2000个左右的词族,在一般语篇中的覆盖率是81.3%;后者有570个左右的词族。在科技语篇中的覆盖率是8.5%。这2000个词族可以再细分为前1000个词族和后词族。   实例分析:   我们以新视野大学第二版第二册的第一和第二单元的A课文为例。   此软件的主界面如下图:      图1中的左下中的nation_basewords_1.txt,nation_basewords_2.txt和nation_basewords_3.txt 分别就是West的2000个词族和Coxhead的570个词族。      从表1我们可以发现,第一课的课文单词总数??685个,其中包含在词表1中的单词有553个,占整个课文单词的80.73%;在词表2中的单词有47个,占整个课文单词的6.86%;在词表3中的单词有42个,占整个课文单词的6.13%;未包含在上述词表中的单词有43个,占整个课文单词的6.28%。第一课的课文单词形符总数是357个,其中包含在词表1中的形符有239个,占整个课文形符的66.95%;在词表2中的形符有41个,占整个课文形符的11.48%;在词表3中的形符有37个,占整个课文形符的10.36%;未包含在上述词表中的形符有40个,占整个课文形符的11.2%。第一课总共有308个词族,其中包含在词表1中的词族有200个,占整个词族的64.94%;其中包含在词表2中的词族有36个,占整个词族的11.69%;其中包含在词表3中的词族有32个,占整个词族的10.39%;未包含在上述词表中的词族有40个,占整个课文单词的12.99%。   从表2我们可以发现,第二课的课文单词总数是822个,其中包含在词表1中的单词有653个,占整个课文单词的79.44%;在词表2中的单词有61个,占整个课文单词的7.42%;在词表3中的单词有96个,占整个课文单词的1.46%;未包含在上述词表中的单词有96个,占整个课文单词的11.68%。第二课的课文单词形符总数是383个,其中包含在词表1中的形符有254个,占整个课文形符的66.32%;在词表2中的形符有50个,占整个课文形符的13.05%;在词表3中的形符有11个,占整个课文形符的2.87%;未包含在上述词表中的形符有68个,占整个课文形符的17.75%。第二课总共有308个词族,其中包含在词表1中的词族有200个,占整个词族的64.94%;其中包含在词表2中的词族有36个,占整个词族的11.69%;其中包含在词表3中的词族有32个,占整个词族的10.39%;未包含在上述词表中的词族有40个,占整个课文单词的12.99%。   对比表1和表2,就会发现课文2无论在词形总数上还是在词符总数上都比课文1多;在各个级别的词表上,除第一、三级别外,课文2都比课文1所占的百分比高,但第一级别所占的比例高正好说明文章越简单。所以从总体上考

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档