《理智与情感》语料库检索分析.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《理智与情感》语料库检索分析

《理智与情感》的语料库检索分析   摘 要: 语料库语言学作为一门新兴学科,可以应用于文学批评领域来分析文学文本。本文用语料库方法分析简?奥斯汀的《理智与情感》,揭示小说情节、人物塑造,以及作者的写作技巧。   关键词: 《理智与情感》 语料库检索 分析      一、引言   最近几年来语料库语言学正以其独特的优势得以迅猛发展,语料库已经被广泛应用于与语言学相关的各个领域。语料库检索软件在语言学领域,尤其是在文本分析中已被广泛使用。语料库检索结果就是从一个语料库中抽取一个文本的一个检索词及其出现的语境按字母顺序罗列出来,语料库检索软件是提供这些词的罗列结果的系统,使用既简单又省时,因为它可以快速有效地显示出检索词的搭配词频。作为一种建立在庞大的数据基础上的极有威力的假设检验设置,语料库索引可以使文本隐含的结构显现出来,同时还激发人的想象力,并检验文本对读者的感染力,具有很强的客观检验性。语料库语言学不仅仅用于语言学,更能用于文学批评领域来分析文学文本。我旨在探讨语料库检索软件在分析文学文本中的应用,选用英国著名小说家简?奥斯汀的小说《理智与情感》,对其情节、人物和写作风格用语料库检索软件进行分析,希望读者能领略语料库检索软件在文学批评分析中的魅力。使用的语料库检索软件是Wordsmith。   二、用Wordsmithl软件对《理智与情感》文本进行统计,通过得出的数据,从三个方面对该文进行分析。   1.运用Wordsmith分析小说的语言特色。   通过该软件,我们可以发现小说共有112359个词,其中有11966个不同的词。表1为出现频率前50的词。不难发现,同一个词的某些形式出现的频率较多。比如,过去式“was”出现了1629次,而原形“is”出现了680次;“were”排在48位,而“are”根本就不在前50个词当中。这表明,作家在创作小说时,经常使用过去时态来讲述故事发展情节。而且列表当中某些词类出现得比较多,如“that”、“which”、“what”这些指示代词,这可以说明小说的语言中有很多从句,而且句子的结构也远比口语中句子结构要复杂。这是英语书面语的另一特征。我们还可以??这张表中获得一些信息。比如“her”和“she”这两词排名都比较靠前,一个排在第5,一个排在第11。“her”的使用次数比“she”多出很多,可以推测“her”有时候是作宾格使用,有时候是作物主代词使用。再如“I”排在第7,而宾格的“me”排在第44。这些代词在小说中频繁出现,必然跟小说的内容息息相关。我们可以推断,故事中会有很多女性,否则作者不会如此频繁使用女性代词主格、宾格和物主代词。再根据词语列表中的第30位的词,即“Elinor”,这很明显是个女性名字,因此,在这些女性当中,Elinor必定是一个主要的角色。我们还可以作出一个推断,即小说中必然有很多人物对话因为在对话中,人们会经常使用第一人称,现在第一人称的I和me都出现得比较多,所以小说中人物对话也不会少。语料库软件可以印证这个事实。在concordance中搜索“I”就会列出“I”出现的所有的上下文。如果我们利用软件中的“concordance plot”功能,我们还可以得到每一章中“I”出现的位置和数量。这样我们就可以知道哪一章的对话较多,同时这一章中,哪一块的对话比较集中。根据词频列表,我们可以分析推断得出小说上述的时态、句式、语体等方面的特色,其它更为详尽的内容还需要进一步的阅读与分析。   通过分析,还能得出以下一些简略的统计数字:   标准句长:25.01   在这个文本中,从其字节数,形符数和句子数可以断言这是个较短的文本,把其类符形符比10.65与标准类符形符比数45.05想比较,可以推断此文本的词汇变化量大。单纯的形符数和类符数不能反映语篇的本质特征,但两者的比率却在一定程度上反映了语篇的某种本质特征,即用词的变化性。它的句长为26.32,与标准句长25.01相比,它比一些简易文本句子要长.它段落长为1742.82,比平均段落长730.96要长些。如果我们把一个字母的词,两个字母的词,三个字母的词和四个字母的词加起来,就可以知道少于四个字母的词为67932,而这个文本的形符数是112359个,这样整个词汇的60.5%都是多于四个字母的词。因而可以推断这个文本属中等难度水平,句子较长,段落较长。   2.通过语料库语言学统计工具分析小说的情节发展。   要理解一部小说的精髓,必须掌握其行文的脉络和贯穿始终的情节。这种对情节发展的把握可以通过对原著的通读来完成。本文要使用的方法是通过使用Word Smith语料库检索软件中的Wordlist和Plotting功能对小说文本的情节进行统计分析。   通过对全篇小说keyword的总结,可

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档