- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
该文档均来自互联网,如果侵犯了您的个人权益,请联系我们将立即删除!
语料库在外语教学研究中的应用及方法潘璠计算机辅助语言教学研究所华 中 科 技 大 学 外 国 语 学 院2008年4月 Outline:1.语料库和建库原则2.语料库检索方式3.运用语料库进行外语研究:方法和实例4.语料库资源介绍 1.语料库和建库原则 语料(corpus),又称为素材,是自然发生的语言材料(包括书面语和口语)的集合。 可以用来作为描述一种语言的出发点或用于证实有关一种语言的假设的手段(Crystal,1991)。 语料语言学(corpus linguistics)是以语篇(text)语料为基础对语言进行研究的一门学科,是计算语言学的一个分支。 语料库 对语料的处理由较为简单的机器可读形式发展到人工或自动词性附码(tagging)和句法分析(parsing)的注释(annotated)形式。 利用语料对语言进行研究的成果已被用于辞典编纂和语言教学等实际工作中,例如1980年由Sinclair主持的Cobuild计划。这是Collins出版公司与Birmingham大学的合作计划。他们搜集了大量的现代英语口语和书面语素材,逐一分析每个单词的词汇、语法、语义、语体和语用特点。根据这些资料,陆续出版了一系列COBUILD词典和语法等工具书。这些书中的例句取自真实的语言素材,词典中词的释义排列顺序由语料库中得出的统计结果来决定,更加客观地反映了英语的使用情况。此外,词的释义方法更利于英语学习和教学。因此,受到语言学界和语言教师及学生的欢迎。 语料库建库原则 语料库的主要用途之一是发现语言的主要的和典型的用法。 一般用途语料库的语料随机地取自各种来源,在语域方面尽量避免偏向,例如Brown语料库在语域上分为15个类别(新闻报导、社论、新闻评论、宗教、技能和爱好、学术和科技、各类小说和幽默等等)。 语料采集方式最根本的目的在于尽可能保证所采集的语料具有代表性,保证所收录的语料最大程度地涵盖具体语言在诸如语体、语域、地域变体、作品年代、作者性别、题材类型等多方面的比例合理性,进而保证建成后的语料库能囊括具体言语行为的普遍规律性。 语料库建库原则 表1.“英语用法调查”语料库 (I)原始书写语料(100篇) (A)印刷品(46) (B)非印刷品(36) 人文科学 6 ┌ 想象性 5 连续书写品┤ 自然科学 7 └ 资讯性 6 教学 6 ┌ 一般新闻 4 ┌亲密 6 报刊┤ 社交书信┤平等 4 └ 专门报导 4 └疏远 4 文书 4 ┌平等 4 非社交书信1┤ 法律 3 └疏远 4 论说文 5 日记 4 散文小说 7 (C)口语(18) ┌资讯性 4 剧本 4 谈话┤ └想象性 2 正式演说(经转写) 3 故事 2 广播新闻 3 语料库建库原则 (Ⅱ)原始口说材料(100)篇 有准备的演说(未转写) 6 ┌ ┌亲密 24 ┌演说 10 │不公开┤ 自发言语┤ ┌体育 4 │ └疏远 10 └评论┤ │ ┌亲密 20 └其他 4 交谈┤可公开┤ │ └疏远 6 │ ┌亲密 10 │电话┤ └ └疏远 6 2.语料库检索方式 较为典型的检索工具是1996年牛津大学出版社推出的Mike Scott所编制的Wordsmith软件包。这套软件不仅提供了词语检索(Concordancing)并共现上下文的常用功能,还可统计计算出索引单位搭配行为的T(或Z)值、信息相关值(即MI:mutual information)和x平方值,并予以列表显示。它还能快速识别某种文体中经常出现的多词集合,且提供在整个语料库中对英语教师和英语学习者具有价值的语言特征。就连传统的关键词(keyword)功能在Wordsmith软件包中也已赋予新用途,如可列选出在特定文本或文体类型中出现频率特别高的词
文档评论(0)