词汇与语料库.pptxVIP

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
词汇与语料库

Chapter 12 语料库语言学与英语词汇研究;12.2 语料库与词频统计; 例如,Cambridge International Corpus (CIC)剑桥国际语料库是一个收词量超过10亿的大型数据库,收集了多种权威口语和书面语语料资源。以33万个单词为基础生成的最常用50个词汇。 ;词频统计的作用 通过以上词频统计发现:书面语词频表主要由功能词(function words)组成,如代词、限定词、介词、助动词、情态动词、连词等,而口语词频表里面包含不少的实义词,如know、well、got、think、right等。正如普通预想那样,功能词在两个词频表中都占据多数。; 词频表除了可以排列高频词的次序,还可以统计词汇出现的次数、所占百分比、具体位置等。 例如,以历任美国总统就职演说为语料(总词数133399)所做词频表。 Wordsmith Tools所做为单词词表,AntConc所做为词块词表。;应用:词语出现的频率信息已经开始出现在词典中。例如,Longman Dictionary of Contemporary English(1995)标注了一个词是否属于最常用的1000、2000或3000口语词和书面语词。频率信息不光限于词的形式,对于一个词的不同意义的频率也可以进行统计分析,语料库为词典编撰提供意义频度也只是一个时间问题了。;12.3 语料库与词汇语义研究; 下表显示的是从British National Corpus (BNC)截取的带有horde和people的词汇索引:;近义词between vs. through Kennedy(1991:95-110)运用OCP检索软件在100万词的LOB语料库上对英语学习者常不易分辨的两个介词between vs. through进行了检索和分析。 ①between左邻搭配词中的名词比例大大超过through,而through左邻搭配词中的动词频率却大大超过between。 ②between之后的名词多为复数形式或者是由and组成的名词短语,如person and person, place and place, date and date等,而through后面的名词多为单数,如the window, her mind, the door, the house等。 ③短语的不同语义功能:1) between+noun/nouns的短语通常表示“地点、移动、时间、分割、共享等意义”; 2) through+noun/nouns的短语通常表示“自由移动、穿越障碍、对障碍的感知、时间、实施—媒介—工具关系、因果关系”。 ④最常用的搭配词:between的location功能中比较常见的名词有channel,gap,space等,在through的unimpeded motion功能中较常见的动词有go,pass,move等。 ; 词频:丁俊(2008)。基于语料库的美国总统就职演说研究。天津外国语学报,15,25-31。 以1933年至2005年19篇美国总统就职演说为语料,统计高频人称代词:we使用频率为889次, 占总单词的2.61%;I的使用频率为202次, 占0.59%。第二人称代词的使用频率为88次, 占0.26%;第三人称代词的使用频率为216 次, 占0.64%。第一人称代词的使用占绝对多数, 为3.2%, 其次是第三人称代词, 第二人称代词则使用较少。 分析为什么第一人称代词,尤其we使用最多,而第三人称、第二人称代词使用较少。探讨了公众演讲人称代词使用技巧。 ; 词块、语境:罗建平(2011)。国总统就职演讲主题词的语料库分析。浙江外国语学院学报,5,46-50。 早期演讲使用station、methods 等词较多,后来的意义和用法发生了变化。现代英语station 是车站的意思,而早期演讲指的是职务、职位等意思,如: for the station in which I am placed( 第1 任华盛顿) ,to be elected to a station( 第2 任亚当斯) , to retire from this station( 第3 任杰弗逊) , for official station( 第14 任皮尔斯) 。到艾森豪威尔以后station 不再出现,被position 取代。 至于methods( 和method) ??南北战争后频繁使用,如: the only sure method of returning( 第18 任格兰特) ,

文档评论(0)

wyjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档