基于语料库与语料库驱动的词语搭配研究.pdfVIP

基于语料库与语料库驱动的词语搭配研究.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
当代语盲学第4卷2002年第2期101一I14页,北京 基于语料库和语料库驱动的词语搭配研究 卫乃兴 上海交通大学 提要 本文介绍和讨论语料库证据支持的词语搭配研究的基本方法和主要原则。基本研究方法 可分为“基于语料库数据”和 语“料库数据驱动”两类。基于数据的方法以语料库索引为基本依据, 在传统的句法框架内对词项的搭配进行检查与概括;数据驱动的方法基本上不将句法结构作为 主要参照,而设计和采用一套概念体系、步骤和程序提取和计算搭配词,凭借统计测量手段研究 词语搭配的模式,或者采用技术手段提取和计算词丛。主要原则包括:以“自然发生数据”为基 本依据.定量分析与定性分析相结合.采用词语中心的研究方法,以发现词组为目的等四项。文 章首先讨论词语搭配研究的基本方法.然后概括研究应遵循的主要原则。 关键词 索引 类联接 搭配词 显著搭配 词丛 定量研究 数据驱动 1.引言 词语搭配研究之父Firth(1957:12)曾说:“Youshallknowawordbythecompanyit keeps.”即词的意义从与它结伴同现的词中体现。根据Firth的观点,词项的结伴规律、结伴 词项间的相互期待与相互吸引(mutualexpectancy,mutualattraction)、搭配成份的类联接 (colligation)关系等都是词语搭配的形式属性,都是词语搭配研究的重要内容。研究这些内 容、描述词项的搭配情况一直是英国语言学的一个传统。但是,语料库问世前的研究,由于 缺乏足够的自然数据,一般都基于直觉,很难深入下去,研究结果也有很大的局限性。语料 库语言学的兴起为词语搭配研究开辟了崭新途径与广阔前景。在语料库研究中,词语搭配被 赋予新的理念。研究者建立了一套概念体系,采用一系列方法与技术来提取信息、处理数据 和描述搭配行为,研究的效度因此大大提高,搭配得到深入的探讨和详尽的描述。总的来 说,语料库证据支持的词语搭配研究有两种基本方法:基于数据的方法(data—basedap— proach)和数据驱动的方法(data.drivenapproach)。具体的作法有三种:(1)利用索引证据、 参照类联接,检查和概括词项的搭配情况;(2)计算搭配词,采用统计测量手段,靠数据驱 动研究词语搭配模式(pattening);(3)采用技术手段,从语料库提取并计算词丛。本文根据 笔者的语料库研究实践,并参照国内外同行的有关研究,对这三种方法逐一介绍和讨论,并 概括语料库证据支持的词语搭配研究的重要原则。 2.基于索弓l证据.参照类联接.检查和概括词项的搭配行为 类联接是词语搭配研究中的一个重要概念。它指的是文本中语法范畴间的结合。类联接 不是与词语搭配平行的抽象,而是高一级的抽象(Firth1957)。Mitchell(1975:120—122)认 *作者由衷感谢杨惠中对本文撰写的指导,他对文章的初稿提出T~-t*修改意见,并对成稿后全篇论文的观 点、思路等提出了宝贵建议。 2002年第2期 10I 论文网 论文大全 为,类联接是关于词语组合类别的抽象表述,搭配则是类联接的具体实现。简言之,类联接 是词语搭配发生于其中的语法结构和框架。一个类联接代表了一个类别的词语搭配,可称为 搭配类(collocationalclass)。人们常说的N+V,V+N,N+N等都是类联接,代表一类搭 配,而evidencesuggests,performanalyses和corpusevidence等则分别是这几个类联接的具 体实例。在研究中,研究者可根据具体的研究内容和目的,界定繁简程度不同的类联接,如 DET+N+PREP即为一个类联接,代表一类搭配,asortof,apairof,acoupleof,a8e— tiesof等则是其具体实例(RenoufandSinclair1991:131—132)。词语搭配研究的通常作法 之一就是以词项为中心,参照类联接框架,观察、概括和描述词项的搭配。 索引 ocnocrdance),即语料库中含有所研究的关键词的句子片段。词语搭配研究所用的 索引一般是KW1C(keywordinocntext)索引,它已成为语料库研究人员的最基本工具之一。 研究人员每一次在语料库中查询,都要将自己即将研究的关键词输人

文档评论(0)

july77 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档