COCA语料库操作演示.重点.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
杨百翰大学COCA语料库使用说明 1. 杨百翰大学COCA语料库简介 Corpus of Contemporary American English (1990-2012)能在线免费提供 400+ million 词,在线网址为:/coca/ 但需要用电子邮箱注册才能使用,对不同使用者有不同层次的要求,对最低层的使用者,每天可检索100次,共10000个KWIC 行。 通过这个网址: 还可以搜索到以下语料库: 图1.1 COCA界面简介 2. 主要搜索功能 2.1 搜索words、phrases、lemmas、wildcards和其他更加复杂的字词 2.1.1 输入单词“mysterious” (图2.1.1-1): 得到相关结果(图2.1.1-2):在各子库中的频率,每百万词使用的频率 若对图2中的相应条块进行点击,那么就可以看到KWIC,如图2.1.1-3 (以点Fiction的条块为例): 图2.1.1-1 图2.1.1-2 图2.1.1-3 2.1.2 输入词组“white+名词” (图2.1.2-1) 得到的结果都是white后面跟的名词短语 (图2.1.2-2),检索表达式为:white [n*] 图2.1.2-1 图2.1.2-2 2.1.3 输入通配符(wildcards),如分别输入un*ly和r?n*,结果如图2.1.3-1和.2.1.3-2 图2.1.3-1 图2.1.3-2 2.1.4 输入lemma(即一个单词的单复数、时态等所有形式),若要得到sing这个单词的所有形式,可以如下图所示(图2.1.4-1) 图2.1.4-1 图2.1.4-2 2.1.5 输入某种词性且部分带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式(见图2.1.5-1)和得到动词+任何词+ground的所有词组(见图2.1.5-2): 规则:若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入: un*ed.[aj*];若要得到动词+任何词+ground的所有词组,那么输入: [vv*]*[ground]即可。前者用来研究词汇,后者用来查询特定词性的搭配。 图2.1.5-1 图2.1.5-2 2.2 搜索搭配词和出现的频率 如 “thick后跟的名词” (图2.2-1) 图2.2-1 如跟在 “smile前面的形容词” (图2.2-2) Confidence前使用的常用形容词 图2.2-3 2.3 搜索在子语料库(register)内(或之间)出现的频率(或比较)(不同语域中的用法) 如在Fiction和Spoken子数据库中passionate后面可以跟任何名词的词及频率,分别如两图(2.3-1和2.3-2) 图2.3-1 图2.3-2 但是也可以之间对两者子语料库中它们出现频率的对比,操作:分别选择section 12,如下图(图2.3-3): 图2.3-3 2.4 进行语义倾向比较 2.4.1 比较近义词 如:近义形容词hot和warm后面所跟名词的区别(如图2.4.1): 图2.4.1 2.4.2 比较反义词 如:woman和man前面所跟的形容词的区别(如图2.4.2) 图2.4.2 2.4.3 搜索近义词 如:搜索beautiful的所有近义词(如图2.4.3-1) 再如:搜索动词clean的所有近义词,如下图: 当然可以进一步搜索与clean语义相近的动词+the+名词的词组,[[=clean]].[v*] the [n*] 如下图: 思考: 1)如何查询多义词特定的词性的KWIC,如for 作连词或介词等? 2)如何查询某个词前/或者后面特定词性的若干搭配词, 如confidence 前的形容词? 3)词性附码应放置在什么位置? 规则:在WORDS的方格里分别输入woman和man,再在COLLOCATES方框里输入[j*],选在左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。 规则:在WORDS的方格里输入[=beautiful],表示和beautiful语义相近的所有形容词。 图2.4.3-2 图2.4.3-3 * 1. 显示方式 2. 关键词输入栏 3. 子语料库 4. 最小匹配 5. 结果栏 6. KWIC 栏 使用chart 显示 注意:选LIST 规则:输入名词的话用正则表达式: [n*];动词: [v*]; 形容词: [aj*]; 副词: [av*] ….. 既可以直接输入,也可以从POS LIST 栏选择 对于“[n*]”,可选择 “no

文档评论(0)

tt435678 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档