毕飞宇作品上海往事语料库检索分析.docVIP

毕飞宇作品上海往事语料库检索分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕飞宇作品上海往事语料库检索分析

毕飞宇作品上海往事语料库检索分析   摘 要: 文章利用语料库检索软件AntConc3.4.4对毕飞宇作品《上海往事》从主题、故事情节和人物形象塑造等方面进行分析。首先,利用软件的主题词功能提取出主题词并进行了归类,结果印证了作者为女性发声的主题。然后,利用软件的索引功能对主要角色“小金宝”进行检索,对每一条检索结果根据其描述内容和情感倾向做了人工标注并统计,表明了“小金宝”在三个地点与不同人物之间的关系对小说人物塑造和情节发展起到了至关重要的作用。   关键词: 语料库 毕飞宇 上海往事 主题词 主要角色   一、前言   毕飞宇被认为是“最了解女性的男性作家”,在1994年出版了长篇小说《上海往事》,2000年出版了中篇小说《青衣》,2001年出版了中篇小说《玉米》(包括《玉秀》和《玉秧》),2005年出版了长篇小说《平原》,四者是女性文学的代表作品。通过百度学术统计,截止2017年12月,以“毕飞宇”为关键词的论文共有9580篇,其中以《上海往事》为关键词的论文有4篇,以主要人物“小金宝”为关键词的论文有2篇,但是迄今为止还未发现有运用语料库手段对该小说进行文本分析的例子。   “语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响。”这是汤姆斯等人1996年为祝贺语料库语言学的主要奠基人和倡导者里奇六十诞辰而编纂的语料库语言学研究论文集的开场白。语料库语言学,顾名思义,就是利用语料库方法来研究某些语言学问题。文学批评是定性的、阐释性的,以阅读体验为基础的研究。而语料库方法则是量化的、描述性的,以概率为基础的语料统计分析,因此,语料库研究分析更系统更可靠。但目前基于语料库的文学作品研究主要局限于分析外国作品,真正利用语料库工具来分析中国文学作品的研究甚少。针对这一现状,笔者先对中文生语料进行预处理,利用TextPro(文本批处理工具)V6.5.2软件进行文本的合并和批处理,比如英文标点符?和中文标点符号的转换、删除空格、删除空行、删除重复行等等;然后利用CIPP-CTOOLS(分词软件)对文本分词;最后再利用软件AntConc3.4.4进行主题词分析和高频词检索,对主题词进行了归类,对高频词进行了人工标注和统计。目的是通过语料库方法对毕飞宇作品《上海往事》进行量化分析和定性研究,为已有的文学阐释提供实证支持的同时,挖掘前人研究中尚未发现的文本意义,并探讨基于语料库的研究方法在揭示中国文学作品显性和隐性内容时的可能性和局限性。   二、基于语料库检索的《上海往事》的分析   (一)主题和情节检索   通过提取和分析文学作品中具有超常频率的词或词组,可以确定文本的主题词和表达该主题的词集。主题词的提取原理是通过对比一个连续的整篇文本和一个更大的参照语料库,把文本中词频具有显著差异的词语提取出来,生成一个主题词表。因此,统计主题词需要建立两个语料库,一是观察语料库,二是参照语料库。在本研究中,观察语料库是毕飞宇的长篇小说《上海往事》,总字数为107107。而参考语料库是毕飞宇的另外三部女性主题的小说《青衣》《玉米》《平原》,总字数为416558。具体内容如表1所示:   选择将《青衣》《玉米》《平原》三者合并作为参照语料库是因为都是女性主题的小说。《上海往事》是作者早期的作品,通过对特定时代下的小金宝悲惨命运的描述揭露一个时代的黑暗和小人物命运的悲哀。观察语料库和参照语料库之间存在紧密联系,都从女性文学主题上对宿命论和情欲论进行了思考,最重要的是展现了特殊时代的城乡二元对立的背景下社会底层的女性该如何追求自由与幸福的思考与拷问。   首先,利用南京师范大学贺胜的中文分词软件CIPP-CTOOLS对观察语料库和参考语料库分别进行分词。因为分词软件对于人名和地名等一些未登录词并不能准确切分,因此,在对语料库进行切分之后进行了人工校对。然后,利用AntConc3.4.4软件进行了Word List的词频统计,按照词频高低进行排序,选取排名前20的词语进行展示,如下表2和表3所示。通过词表看出,除了主要人物名称小金宝和老爷等称呼排在前20之外,还有另外两类词语的频率很高,一类是称谓语,如我、你、他、她等;一类是否定词,如不。这些高频词的出现对于我们通过AntConc3.4.4软件Keyword List功能进行主题词表的确定和归类有相当大的帮助。最后,通过AntConc3.4.4软件对观察语料库和参考语料库确定主题词表并进行归类。以观察语料库为主要对象,参考语料库为参考对比对象确定的关于《上海往事》的主题词表,因为主题词并不是全部都表示实际含义,其中还包括介词等虚词,所以需要选取Keyword List中的主题词进行分类,并且通过AntCon

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档