基于语料库苏童作品风格探究.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语料库苏童作品风格探究

基于语料库苏童作品风格探究   摘 要: 基于语料库技术对文本风格进行定量研究在国外已经发展得比较成熟,而国内的文本分析大都还处于文艺风格的内省式研究。苏童是先锋作家的代表人物,第九届茅盾文学奖获得者,并且作品被翻译成多国语言,在国内和国际文学上有很大的影响。从语言学角度研究其文本风格的很少,我们采用计算风格学理论,利用语料库技术对苏童的代表作品进行从高频词的使用、标点符号的运用以及文本阅读难度三个方面分析 关键词: 苏童 作品风格 计算风格学 语料库 基于语料库的定量分析属于验证性的分析,我们的研究试图通过定量分析验证内省式分析的结论并且发现内省式研究不能得到的结论。苏童是先锋作家的代表人物,第九届茅盾文学奖获得者,并且作品被翻译成多国语言,在国内和国际文学上有很大的影响。苏童擅长描写女性,其作品中包含了不同类型的女性形象;他出生在江苏,作品中有着江南水乡的影子;谢光胜(2015)指出苏童小说语言的“陌生化”程度比较高的特点,其中包括标点符号的陌生化 上世纪30年代,西方文体学界引入了定量分析,尤其是统计学的方法。到了50年代,由最初的人工统计文本中的语言项目,到后来借助计算机进行统计,大大提高了研究的效率。这种研究方法取得了很大的成就,逐渐发展成一支独立的学科――计算风格学(Computational Stylistics)。计算风格学是数理语言学的一个分支,其理论基础是写作是个人将思想通过文字表达出来的一种活动,其隐含的是作者语言编码的方式,作者本人可能也察觉不到。因此,可以通过量化文本中语言结构的方式发现作者的写作风格 1.自建作品语料库 20世纪90年代,随着计算机技术和互联网的快速发展,文本的搜集变得更加方便,文体学研究呈现出了Leech和Short(2001)所说的“语料库转向”。言语的使用差别很大,仅仅凭内省式的言语感知是不能很好地判断的。使用语料库则极大地提高了文本分析的效率和精确性,避免了人们主观上的误差,为文本分析提供了一种新的分析方法。我们自建了苏童作品语料库,包括了他的四部代表作品,共571477字。具体如表1: 我们自建的语料库的语料是从网上下载的,根据权威网站的文本,加上人工校对,以纸质版书籍?橐谰荩?确保语料的正确性。语料是我们分析研究的对象,语料的正确性决定着研究结果的正确性。然后就是对语料的处理,主要是分词。因为本研究中并没有涉及到词类,因此我们使用的是中科院张华平老师的分词软件。该分词软件正确率很高,但是我们也对处理后的语料进行了人工校对。分词主要是关系到类符形符比这一分析。数据的统计,使用AntConc可以帮助我们统计高频词和标点符号 2.苏童作品分析 2.1基于语料库的高频词分析 高频词是文本主题的反映,根据高频词我们可以知道作家的写作内容主题以及关不同文本之间的差异。这里的高频词仅仅只是实词,不包括虚词。我们用AntConc的Wordlist功能处理苏童作品语料库可以得到前100个高频词 根据表2,我们可以分析一下苏童作品的高频词。关于代词,出现了我、她、他、你、自己、这、他们、什么、怎么、谁等。名词包括人、女人、手、母亲、父亲、祖父、男人、孩子、眼睛、老板、家、天、事等,这些词中女人、母亲出现的频率最高,在代词中,表示女性的“她”也要高于其他代词。人名包括五龙、保润、颂莲、柳生、织云、绮云、慧仙等,其中七个人名中有四个是女性。可见苏童的作品中女性比较多。动词包括说、去、到、要、来、看、吃、住、知道、去、走、坐、想、用、会、做、出、起、跑、问、叫、拿、生、听、打、站等,这些词都是描述日常生活中的动作,是对日常生活的描写。其他的名词如米、船、河、水等,在苏童的小说中出现了很多与南方生活相关的词汇,这些词汇使苏童的作品更加具有江苏本地特色 2.2基于语料库的标点符号分析 标点符号是文字序列的组成部分,相同的语言使用不同会有不同的表达效果。朱德熙先生在《语法修辞讲话》中单独对标点符号进行了解释,他指出了标点符号在现代汉语中的重要性:“标点符号是文字里面的有机的部分,不是外面加上去的。”以及标点符号在文本中的作用:“自从有了标点符号,文章的风格也收到了影响。最显著的,有问号……有了引号……有了破折号和省略号……”可见,标点符号在书面语的表达上的重要性。因此,我们对四部作品中的标点符号进行统计。这些标点符号分别是逗号、句号、问号、感叹号、省略号、破折号、引号冒号和顿号 根据表3,我们可以看出来,逗号、句号、问号、叹号、顿号等频率随着文本容量的增大而增加,只有省略号、破折号、双引号、冒号的频次没有出现增加的趋势,并且也没有规律可循。破折号、省略号根据其表达需要可以是根据作家的写作内容而定,但是小说中的大量对话使得双引号和冒号不可或缺

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档