基于CNN语料库批评话语分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于CNN语料库批评话语分析

基于CNN语料库批评话语分析   【摘要】新闻报道在大众传媒中占据着重要地位,不仅是传播信息的主要方式,更是非语言信息的载体,如意识形态,话语权力等,从而影响人们的判断。笔者搜集2012年到2016年CNN中有关钓鱼岛事件的相关报道,自建小型语料库,从评价的角度进行批评话语分析。以Wordsmith为研究工具,通过词表功能对词频进行分析,通过关键词检索确定主题词后对相关主题词进行进一步研究。   【关键词】CNN 语料库 批评话语分析   一、引言   批评话语分析(CDA)诞生于20世纪70年代,是由英国语言学家Fowler等人于1979年在《语言与控制》一书中提出的语篇分析方法。CDA主要关注公共语篇,如电视、广播、报刊新闻、官方文件等,“旨在透过表面的语言形式,从语言学、社会学、心理学和传播学的角度揭示意识形态对语篇的影响,语篇对意识形态的反作用,以及两者是如何源于社会结构和权力关系又是如何为之服务的”。然而,由于批评话语分析对话语的解释缺少充分且客观的证据而一直说服力不够大,语料库语言学恰好能弥补这个缺陷,二者的互补结合使结果更具有说服力。   语料库和话语分析的结合由Hardt Mautner(1995)首次提出。Stubbs,Piper等从高频实词、搭配的角度进行过相关研究。本文从批评话语分析的角度,搜集2012年至2016年CNN中有关钓鱼岛事件的相关报道自建小型语料库,借助语料库技术解读CNN中对钓鱼岛的相关报道。   二、语料库技术   语料库,作为经验数据的源点,被用于辅助调查以语言为中心的研究命题。语料库技术包括词丛、词频、搭配词、索引分析、语义韵等多个方面。主题词是新闻文本中的关键信息,高频语言型式往往隐含着特殊的意图,需要结合上下文理解。   1.词频。词频可以通过分析软件自动提取,是?Z料库基本的统计手段之一。词频表往往能帮助找到切入点进行研究,所以高频词往往是备受关注的焦点。但是,除了高频词本身,其左右共现的搭配词同样值得研究,因为搭配能够展现这个词的习惯性结构。   2.主题词。将目标语料库和参照语料库进行对比,出现词频差异较大的词,将这些词提取出来,生成主题词表进一步研究。统计主题词时,参照语料库并不是一个固定的语料库,其大小、体裁、时间跨度等都需要依据研究目的而定。主题词在批判话语中具有意义,因为研究者可根据主题词提供的信息进一步解读某种语言现象。   3.搭配。搭配的工作定义是:在某一语法型式下两个或多个词(特别是名词、动词、形容词和副词)的反复共现。按照Firth的观点,词语搭配是一种意义方式,词语搭配现象与类联接有一定联系。要了解一个主题词,往往看它的搭配词便能知晓一二。   4.索引分析。索引分析是语料库语言学的核心,因为他可以让我们看到文本中许多重要的语言型式。索引分析可以延伸到搭配分析、语义偏向和语义韵的研究。卫乃兴认为,语义韵并非指关键词本身有多少积极或消极意义,而主要看其搭配词是否具有某种语义特征。语义韵是将语言表达者的内在态度表示出来。   三、案例分析   本文搜集CNN中2012-2016总共40篇有关钓鱼岛的新闻报道文本,自建小型语料库,总计3.5万词次。文本中共有35664个词,其中有5296个不同的词,可见CNN中关于钓鱼岛的报道信息较为集中,阅读所需的单词量不大。   本文首先对自建语料库的词频进行分析,发现在CNN中出现频率最高的是China, Japan, Japanese, islands, Chinese等实词,这些高频词反映出钓鱼岛争端涉及中日两个国家,主要围绕一个岛屿进行的争夺。   在关键词的前20行索引中发现,高频词中存在dispute,tensions等此类消极词汇,表现出钓鱼岛一直处于紧张的局势中。此外,前20行关键词索引中出现senkaku较多的情况,senkaku是日本官方对钓鱼岛的称呼。   进一步检索senkaku和Diaoyu在库中的使用情况,senkaku出现45次,Diaoyu出现86次。但在词语出现的顺序上,20行索引中有10次Diaoyu是以对senkaku补充的形式出现,且Diaoyu的出现基本是跟中国相关的词,如East China Sea,China等。命名与主权息息相关,报道中做出这样的安排,其意识形态昭然若揭。   四、结语   本文运用语料库结合CDA的方法分析CNN对钓鱼岛争端的意识形态,介绍并验证了语料库技术如何有效地运用到话语分析中。根据自建语料库,确定Chinese,Japanese,Diaoyu,senkaku等词作为研究的切入点分析美国媒体的话语。在批评话语分析视角下,借助语料库技术对大量语料进行分析,在量化的基础上进行探讨,发现媒体在信息传播中意识形态的体现及策

您可能关注的文档

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档