- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于美国当代英语语料库同义词辨析.doc
基于美国当代英语语料库同义词辨析 摘要:英语中有大量同义词,对英语学习者来说,区分有难度,而对区分同义词的研究涉及较少。利用语料库中的语料来自真实语境以及其数据可客观反映语言现象等特点,本研究拟通过美国当代英语语料库,基于数据,从词语使用语域,共现搭配两个方面对同义词进一步区分。以一组同义词gloomy和sad为例,发现这组同义词在不同的语域中分布频率不同,具有各自的语域分布倾向;在共现搭配中,该组同义词的常用搭配不同,呈现出不同的语义,从而丰富了同义词语的含义。研究还发现基于语料库对于同义词辨析非常有效。 关键词:同义词;美国当代语料库;语域;共现搭配 一、引言 同义词的英语为synonym,源自希腊语,是指意思相同但形式不同的两个或以上的词语。英语中包含了许多同义词。据统计,“英语语言中同义词、近义词的数量约占总词汇量的60%以上”。(贺晓东,2003)然而,尽管英语中同义词众多,意义完全一致的词却十分少,绝大多数的同义词是“彼此又有细微的语义差别或具有不同文体色彩的词”。(蒋磊,1998)而同义词辨析是英语学习的难点,亟待解决。 目前,对同义词的辨析主要通过语义学视角,语体学视角和语料库语言学视角。(王家义,2011)“语料库突出特点是所包含的语言真实,数据量庞大。”(梁茂成,李文中,许家金,2011)语料库中的例句均来自真实语境,并且数量多,涵盖面广,并通过一定的统计手段,可以真实客观的反映语言现象。而语料库语言学随着计算机技术的发展和应用而兴起,以实证和数据为基础,为同义词的辨析提供了新的研究思路。本文将沿着语言库语言学的研究方法,以同义词组gloomy和sad为例,辨析其语义差别。 本研究采用的是美国当代英语语料库(以下简称COCA),其词汇量高达3.6亿。它是美国最新当代英语语料库,也是当今世界最大的英语平衡语料库,为使用者提供充足的自然语言文本,保证了本研究的真实可靠。 二、研究方法 “语言中的概率信息是其最本质的重要信息。”(卫乃兴,2011)本研究是基于语料库对同义词进行辨析的研究,将着重分析同义词的概率等所蕴含的信息。结合梁茂成等在《语料库应用教程》中对语料库词语辨析方法的概括,“对语料库进行分析,得到各种词语搭配和结构在语料库中的出现频率、使用场合、语体等等信息”。(梁茂成,李文中,许家金,2011)综合本研究的研究重点及语料库的研究方法,将从语域,搭配这两个方面对同义词进行辨析。 (一)语域分析 1.理论基础。“以韩礼德为代表的系统――功能学派特别强调语境,即语言发生的环境。他们认为语言在一定的语境中发生,并在一定的语境中被理解或得到解释。”(张德禄,1987)语境是指词语的情境使用范围,即语域。不同的语域具有不同的特点。分析同义词不同语域分布情况,可以得出词语的语域倾向。2.COCA语料分析。在COCA语料库中,由五个子语料库组成,他们分别是口语、小说、杂志、报纸、学术期刊。口语中的语料主要来自于美国的广播公司和有线电视,广播和电视作为公共媒体,其语言有既大众化又有一定的规范性。小说的语言一般由于其体裁的多样性,其使用的语境较为复杂。杂志作为公开发行物,其语言一般较为正式,同时又通俗易懂。学术期刊因为其专业性,一般要求语言精确,客观,简明。3.具体分析方法。在分析目标词的使用语境时,通过COCA语料库检索,可以得到目标词在不同语域的分布情况。例如,在语料库出输入outraged一词,用图表(chart)功能显示,可以得到其在不同语域的分布情况,如图1所示。Section表示不同语域,All表示所有领域,Spoken Fiction Magazine Newspaper Academic分别表示口语,小说,流行杂志,报纸,学术期刊。FREQ是frequency的缩写,代表出现的次数,为实际频数,PERMIL代表per million,即表示目标词在该语料库每一百万词中出现的次数,即标准化的频数。实际频数因为来自于不同的语料库,直接比较其大小没有多少意义,一般比较标准化的频数,在此项研究中,主要比较PERMIL这行的数据。Seeallsub-sectionsatonce是该语料库的一个功能,表示可以同时看到所有的子语料库。 图1 outraged在COCA中不同语域分布情况 (二)共现搭配词分析 1.理论依据。“语料库的研究表明,词项的搭配行为显示出一定的语义趋向:一定的词项会习惯性地吸引某一类具有相同语义特点的词项,构成搭配。”(卫乃兴,2002)同义词不同的搭配,可以看出同义词不同的语义趋向,呈现出某种特征。运用语料库进行检索,需要考虑的问题包括选取多大范围作为词语的语境,以何标准筛选出具有代表性的搭配行为。参考卫乃兴的阐述“跨距长度界定要视所研究文本题材领域(topic field)等诸多影响词语
您可能关注的文档
- 基于Φ―OTDR技术的通信光缆险情定位与预警系统设计与实现.doc
- 基于“中国梦”视角探讨大学生的理想信念教育.doc
- 基于“工学结合”的城市轨道交通运营管理专业人才培养方案的制定.doc
- 基于“工学结合一体化”教学模式的探讨与实践.doc
- 基于“意图”探寻的演讲类实用文阅读教学策略.doc
- 基于“政、行、企、校”四方联动的地市级高职院校办学体制机制创新目标探究.doc
- 基于“活的教育”理念的小学语文教学情境创设策略.doc
- 基于“过程性评价”的高职检验专业课程 考核方法的改革与实践.doc
- 基于“钻石模型”中国风能产业竞争力影响要素分析.doc
- 基于“项目驱动”的《EDA技术》课程教学模式的探索.doc
原创力文档


文档评论(0)