网站大量收购闲置独家精品文档,联系QQ:2885784924

词性赋码语料库的检索与正则表达式的编写中国英语教学研究会.pdfVIP

词性赋码语料库的检索与正则表达式的编写中国英语教学研究会.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
词性赋码语料库的检索与正则表达式的编写中国英语教学研究会

 2009年5月 中国外语教育 (季刊) May 2009 第2卷 第2期 Foreign Language Education in China (Quarterly) Vol. 2 No. 2 词性赋码语料库的检索与正则表达式的 编写1 术 技 育 教 语 外 梁茂成 北京外国语大学 © 2009 中国外语教育(2),65-73页 提  要:标注可以为语料库带来增值(added value)(Leech 1 7),这一思想已 经逐渐成为语料库语言学界的共识,因而标注语料库也逐渐成为大型语料库最基本的 规范之一。在外语教学与研究中,我们常常可以利用功能强大的正则表达式(regular expressions)对词性赋码语料库进行检索并从中提取各种所需信息。然而,由于正则表 达式中所使用的各种符号有别于自然语言中的词语,对于绝大部分从事语言教学、语言 学习和语言研究的人来说不无难度,又由于检索是语料库操作中最重要的环节之一,如 何有效使用正则表达式对语料库进行检索成为语料库教学和研究中的难题之一。 本文分析了词性赋码语料检索的基本特点,介绍了一种由研究者自行设计的针对词 性赋码语料库检索的正则表达式编辑环境,并对如何使用这一环境编写正则表达式在词 性赋码语料库中检索进行了探讨。 关键词:语料库;标注;检索;正则表达式 1. 语料库的标注 随着语料库规模的日趋扩大和标注体系的 完善与复杂化,如何对语料库进行有效检索成为 近年来,随着诸如BNC (British National 一个新问题。一般说来,语料库检索工具大致 Corpus )、BoE (Bank of English )、ANC (American 可以分为三类。一些大型语料库 (如BNC, BoE National Corpus )等大型语料库的不断问世,语 等)常常配备有专用的检索工具,这是第一类。 言教学与语言研究中是否可以、是否应该使用 这一类检索工具为大型语料库量身定做,其特点 语料库已有定论。语料库已经成为语言研究中 是速度较快,通过较为复杂的设定,可以提取 默认的数据源 (Teubert 2005 )。与此同时,正如 语料库中的多种详细信息。检索时大多支持正 Leech (1997 )所言,对语料库进行各式各样的 则表达式 (regular expressions )或通配符 (wild 标注可以为语料库带来增值 (added value ),标注 cards ),功能强大。但由于这类检索工具针对特 已经成为大型语料库最重要的基本规范之一。 定的语料库而设计,一般没有可迁移性,无法用 1 本研究为教育部哲学社会科学研究项目(编号06JA740007)的部分研究成果。 65 词性赋码语料库的检索与正则表达式的编写 来对其他语料库进行检索。另外,也有一些语 语料库进行检索具有重要意义。 料库 (如MICASE, Michigan Corpus of Academic Spoken English 等)提供一个网络检索工具。和 2. 正则表达式与词性赋码语料库的 第一类检索工具一样,这类工具往往只能针对特

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档