浅议统计语言学在作家语言风格研究中实际应用.docVIP

浅议统计语言学在作家语言风格研究中实际应用.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅议统计语言学在作家语言风格研究中实际应用

浅议统计语言学在作家语言风格研究中实际应用   摘要:统计语言学是应用统计数学的方法来研究语言现象的语言学科,研究领域广泛,学界常常运用统计语言学,通过分析语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。通过“判定《静静的顿河》作者”“证明《红楼梦》是否出自一人之手”两个案例可以看出,统计语言学的研究方法在进入文学研究领域后,取得了非常好的实用效果。但是,在实际应用中,除了各类词汇等可控变量,还有其他潜在因素导致统计语言学的结论有时并非绝对精准。通过进行多方面、深层次地原因分析和推断,我们发现,要得到准确的研究结果,必须做好研究的前期准备,要选择具有相似语言环境的语料,要注意避开文学语言的形象思维影响,不能滥用统计语言学研究方法,并在操作过程中严格控制各种变量,以科学的思想指导研究。   关键词:统计语言学 语言风格研究 实际应用   作为大数据时代语言学研究的一个热点领域,统计语言学(statistical linguistics)属于数理语言学的一个分支,涉及语言学、计算机科学和数学等多个学科门类,是应用数理统计、概率论和信息论等统计数学的方法来研究语言现象的语言学科。   一、统计语言学的研究领域   相较于自然科学,人文科学的研究多涉及人(包括研究者本人)的大脑,因此很容易导致“自我中心性错误”和“内省性错误”。无论是过多地依赖本人的经验,还是过多地依赖自己的内省来做出判断,都会导致研究缺乏客观性与科学性,其价值是有限的。统计语言学则是倡导用科学的方法进行实验,进而得出结论,“特别注重语言本身的系统性和动态性特点,强调语言描写的真实性和精确性”。   从其研究内容看,统计语言学大致可分为语音统计学、词汇统计学、语法统计学和语义统计学,分别研究语言的语音、词汇、语法和语义的统计特征。从其功能看,统计语言学可分为描述统计与推断统计:描述统计的作用是对数据进行整理、归纳和总结,压缩数据,把握其一般性的特征和全貌;推断统计则是根据描述统计提供的结果,进一步对有关联系加以推断。   “统计语言学可用来发现语言学内在规律(词频与词排序之间的关系)、常用词和非常用词、词语搭配、短语获取、语言习得、语域变异以及作品风格分析等领域。”可以看到,统计语言学的研究领域广泛,但其中最主要、最熟稔的实际应用,当属通过语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。统计语言学进入文学研究领域后,还催生出了另一个学科,即文艺风格学,一种应用现代语言学成果和技术来分析研究文学作品的边缘学科。如苏联学者用该方法研究赫尔岑、屠格涅夫的语言风格,国内也有人用这种方法研究巴金、曹禺、老舍等人的语言风格。   二、统计语言学与语言风格研究   黎运汉在《汉语风格学》中指出:“语言表现风格是综合运用风格手段的结果,从调音、遣词、择句到设格、谋篇等的风格手段,综合地反映在一篇文章、一部作品,或一种语体,或一个作家的作品,或一个时代的作家的作品,或一个民族的作家的作品里,这就从成了他们各自的表现风格。”换言之,语言风格的差异,正是由于作者使用特定语言单位的频率不同而造成的。于是,通过对语言结构特征的分析,我们可以比较直观地感受到不同文体与不同作者的风格,得出不同作者语言风格的同一性或?^别性特征,而不仅仅是通过一系列描述型的论述,阐述文体或者语言风格问的差异。统计语言学的诞生,使语言单位的出现频率和分布数据变得重要,成为一种彰显作家语言风格的数学特征。   运用统计语言学判定作家风格的数学特征,其具体过程是:选取两位作家的公认代表作品作为语料样本,首先对样本进行分词处理,以文本为基本单位计算各类语言要素在文本中所占的频率和百分比,根据两个样本的平均值,比较语言要素分布是否具有差异。一般而言,为了测试数学统计特征是否能够有效辨别不同作家语言风格,还可以选用一个作家的其他作品为语料样本,计算该样本与统计所用语料样本的相关性。   鉴于其在判定作家风格方面的显著功效,统计语言学也被成功地运用到“作者考证”这个充满争议的研究领域中。在通过分析匿名文章的写作风格进而判定其真正作者方面,统计语言学也展现出了非常好的应用效果。以往,当某本名著的作者产生争议时,我们只能够凭借经验、历史文献和作家生平记录来进行考证。如今有了统计语言学,我们可以通过严谨的数据分析,提出更有说服力的证据。   三、实际应用案例   (一)《静静的顿河》的作者纠纷案   统计语言学最著名的实际应用,就是成功破解了文学史上关于《静静的顿河》的作者纠纷案。   《静静的顿河》在苏联文学史上占有较高的地位。此书全景式地描写了俄国内战时期顿河流域的社会景观,甚至有人将其与《战争与和平》等名著相提并论。然而自从《静静的顿河》第一

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档