- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论语料库应用于词典释义优势与局限
论语料库应用于词典释义优势与局限 摘要:基于语料库的词典释义新型途径是对传统释义方式的一种重要补充。本文对基于语料库进行词典释义的历史和现状研究进行分析,在此基础上阐述此类研究存在的优势和局限性。
关键词:语料库;词典释义;优势;局限
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2013)30-0118-02
近年来,随着认知语言学的发展和各语言数据库的构建,基于语料库揭示语词的语义特征和词汇关系的研究受到学界的广泛关注,随之而兴起的是基于语料库进行的词典学编纂研究。语料库在现代被认为是词典编纂过程的必要组成成分,基于语料库的词典释义新型途径是对传统释义方式的一种重要补充。本文对基于语料库进行词典释义的历史和现状研究进行分析,在此基础上阐述此类研究的优势和局限性。
一、语料库研究概述
语言研究中的语料库是指以分析语言特征为目的而收集起来的文本集合。(Landau 2005:298),有一定的结构,有代表性,可被计算机程序检索,具有一定规模。(冯志伟 2009)。Sinclair(1991)认为,语言描述只有以自然语境中的真实语言为基础才能进行准确客观的描述。Biber等人(Biber,Conrad Reppen 1998:3)认为,语料库分析研究的目的不是为了判断语言语法的正确性,而是为了通过大规模的语言现实数据来揭示语言使用的典型模式。Leech(1993:107)认为语料库语言学有如下特点:以语言的应用而不是语言能力为中心;以语言描写而不是语言普遍性为中心;以语言的定量及其定性模型为中心;以经验主义而不是理性主义的科学研究方法为中心。目前国际主流英语词典均采用语料库进行编纂,如Collins Cobuild词典采用Sinclair主持的COBUILD语料库,朗文ESL词典使用朗文语料库进行词典编纂,《牛津高阶学习词典》使用BNC语料库,《剑桥国际英语词典》使用剑桥国际语料库。此外,词典编纂也开始使用一些具有先进的检索分析工具和语法自动标注体系的语料库,如word sketch engine等语料库为语词提供了较为精确的词汇描述。
二、利用语料库进行词典释义编纂的优势
语料库应用于词典编纂研究主要存在以下几点优势:
1.提供更客观的语言事实。语料库能够用来发现相关的、核心的、典型的事实(如例证、搭配等),它全面展现了母语者使用语词的自然语境,而这种语境恰好是非母语者所缺乏的语感。语料库还可显示某一语词主要用于哪些语言变体或类别中,并给词典和语法书提供了语法信息的宝贵资源,更好地对每个义项进行释义,提供真实可信的合适例证。此外语料库提供的定量和定性分析也展示了更加直观、更加可靠和更加令人信服的辨析结果,有效避免了基于传统语义学理论视野的词典对词条语义分析与描述的片面性和主观性问题。
2.建立使用频率。语料库的词频统计可以辅助词典选词立目,帮助词典编者决定是否收录某个语词及其词形。常用词在大型语料库中的高频出现为词典编纂者收录高频词提供了现实依据。语料库还能凸显两个词的共现频率,确定常用的语词搭配和惯用法。
3.提高词典编纂效率。在计算机语料库建立之前,人们编纂词典往往采用卡片的方式费时、费力,低效地采集语料。一本大型词典往往要耗费多年才能出版。如今,计算机语料库的建立及便捷搜索工具的使用使得词典编纂者们得以在海量语料中提取词典所需的各种有效语言数据,缩短了词典编纂和出版的时间,提高了语料使用和词典编纂的效率。(章宜华 2012:1)
三、基于语料库进行词典释义编纂存在的局限和问题
1.共时语料库选取时段的问题。目前语料库的建设主要以共时为主。这里就存在一个共时语料库选取时段的问题。如果不能确定共时的时段,对词典编纂将会产生诸多问题。比如语词的时代标签的问题。某些语词多长时间被定义为过时?多长时间被定义为旧,都应该有一个标准。此外,随着时间的变化,某些语词的标签也会发生变化,如方言进入共同语词汇,经过一段稳定期,成为共同语的一部分。拿《现代汉语词典第5版》作为例子来说。该词典将“忽悠”一词标注为,然而笔者认为,该词标为更合适。词典的标签要考虑到历史的演变而及时进行更新,就要参考语料库。而语料库则存在一个时限的问题。如果收录50年以上的语料库,能否还被当成共时语料库?“忽悠”一词在50年中以方言的形式出现的频率多于共同语,而10年间以共同语的形式出现频率则更高。如果在50年以上的语料库中进行词典标签的标注,则会出现标注不准确的问题。
2.词典编纂选用真实语料的问题。词典编纂究竟是采用自撰例还是语料库的真实例子历来就有纷争。Landau认为,自撰例不是人们在实际生活中说的话,很多自撰例甚至从未使用过,对二语习得者来说更达不到
文档评论(0)