- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语料库现代汉语词语搭配研究
基于语料库现代汉语词语搭配研究
摘要:基于语料库语言学理论,利用语料库,运用关键词检索工具,以现代汉语高频名词“家”、“人”为例,从北大CCL语料库中得到500条索引,分析关键词出现的条件,从而对高频名词的搭配有进一步的认识。这项研究不仅可以弥补基于语料库研究汉语搭配的不足,并且在对外汉语教学中有着一定的实践价值。
关键词:基于语料库;词语搭配;高频名词;对外汉语教学
一、词语搭配研究的背景与内容
20世纪中叶以来,语言研究理论与方法突飞猛进地发展,这不但使得语言学成为一门领先的科学,而且也催生了词语搭配研究的日益精密化,这不但表现在理论的革新上,还表现在研究方法与手段的信息化与现代化上。词语搭配是当今语料库语言学最为活跃的领域,在语言学研究领域中处于中心地位。那么如何界定词语搭配?被称作词语搭配行为之父的Firth把搭配定义为:“习惯一起出现的词语。”(洪荣丰,2009年)但这一定义太笼统,似乎只能靠语言学家本身的语感和直觉,缺乏真实的数据来验证其想法。Sinclair(1991)将其定义为:“两个或两个以上的词在文本中短距离内的共现。”这个定义比较宽泛,适用于基于大型语料库的词汇搭配研究。卫乃兴(2002)则认为:“词语搭配是在文本中为实现一定的意义从而以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现。”从一般的语言教学与研究角度看,他提出的搭配概念更具可操作性。
关于词语搭配研究,传统的方法多基于直觉,主要的研究思路和方法包括新弗斯学派的词语学方法,米切尔等人的综合法,韩礼德和哈桑的篇章衔接概念,博林杰等人的惯例化搭配研究。这些靠语言学家个人直觉进行的词语搭配描述,其效度、深度、广度都往往有限。因此,随着语料库语言学在中国的发展以及语料库知识的日渐普及,越来越多的学者开始利用语料库来做研究。语料库研究,就其主要本质特征来说,是基于定量分析的研究,在定量研究的基础上进行定性研究,从而对词语搭配进行语言学描述,提高理论抽象度。这种基于语料库的词语搭配研究所采用的语料库方法是很客观的,具有重要的语言学意义及现实意义。
本文试图利用语料库来研究词语搭配。在这项研究中,我们使用的是北大CCL语料库,其丰富的资源给笔者提供了详实的证据,此外,其数据来自真实语言交际活动,体现了语言使用的真实规律,使我们能对关键词的搭配情况和特点进行较为扎实的概括,不必求助于个人直觉,使研究结果有较高的可靠性。在这项研究中,我们以现代汉语高频名词“家”和“人”为例来具体阐释关于词语搭配的问题。(“家”和“人”是《中国语言生活状况调查(2011)》中统计出的高频词语表中的高频名词)之所以选取高频名词主要考虑到两方面:首先,名词在汉语中所占比重很大,除了在数量上占据优势,名词的功能也众多,它可以充当主语、宾语、有时充当定语、谓语(名词谓语句),有些情况还可充当状语,可见名词在日常生活中是我们广泛接触的词类。其次,研究高频词比较有代表性。在生活中与他人交流或撰写论文时会经常用到这些高频词,这样如何正确使用它就显得格外重要。除了母语学习者,这一研究对外国人学习本土语言也有极大帮助,外国人学习中文要接触大量词汇,首先学习的就是高频词汇,这与我们学习外语是一个道理,在背英语单词时我们总是先背高频词汇,并了解与之经常出现的搭配,有利于更快地掌握一门语言。因此,我们认为研究高频名词的搭配是很有价值的。
二、高频名词“家”与“人”的相关搭配
以“家”、“人”这两个高频名词为例,我们从北大CCL语料库中得到500条该关键词的句子,并对这两个关键词出现的条件做了细致的统计与分析,结果如下表格所示。
1、高频名词“家”的相关搭配
家作为汉语高频名词,能与其搭配的词类有很多,经统计,与其搭配的对象可以是代词、动词、数词、名词、介词、助词、区别词、副词以及形容词,而且各个搭配对象出现的频数是不同的,如上表所示,代词与“家”搭配出现的频数最高,其次是动词,数词、名词与家搭配出现的频数相差无几,助词与介词则少得多,至于区别词、副词与形容词几乎不出现。由于代词出现的几率很高,笔者对其也做了细致的分类与统计。如下表所示。
由上表可知,人称代词出现的频数最高,指示代词次之,疑问代词与其它代词出现频数较少。人称代词中最常出现的是第一人称复数“我们”,高达37次,其单数形式“我”出现12次,其它人称代词如“自己”、“咱们”、“他们”、“她”、“你们”等出现频数相当,在此不一一详述。代词与中心语搭配一般作定语,两者是修饰限制关系。再看与“家”搭配的动词。最常见的是与动词“回”搭配,比如“一年难得回家探亲几次”,这个动词共出现24次,其次是“在”,“在”这个词比较特殊,在与“家”搭配的介词
文档评论(0)