- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语料库的新闻语体中语气词使用状况的统计分析.doc
基于语料库的新闻语体中语气词使用状况的统计分析
摘 要: 基于语料库的词类统计研究越来越受到现代语言学的重视,本文在新闻语料库的基础上对语气词的使用状况进行了统计分析,包括语气词在整个语料库及虚词中的分布情况、语气词的词频统计及分类、语气词的音节数目分布和语气词的语法功能分布等,对语气词教学和解释语气词的使用规律有很大帮助。
关键词: 语气词 语料库 统计分析 新闻语体
一、引言
基于语料库的词类统计研究越来越受到现代语言学的重视,尤其是对单一词类使用情况的统计分析,更是非常有必要,这对于人们了解词类在现实语料中具体的使用情况有很大帮助,但是这方面的研究却不多,所以本文拟从统计学角度对新闻语料中语气词的使用情况进行研究。
语气词常用在句尾表示陈述、疑问、祈使、感叹等语气,永远黏着、后附、轻声。但是由于新闻语体的特殊性,在语言上有着独特的特点。新闻语体的主要特点表现为传播对象的大众性,报道的客观性、真实性、公正性趣味性以及节俭性。这些特点决定了其传播语言多使用意义具体的词汇、通用书面语词汇和通俗常用词汇,那么在虚词及其语气词使用上有什么特殊表现呢?本文将对语气词在新闻语料中的使用情况进行详细定量统计分析,以为语气词的研究提供比较可靠的数据。
二、语料库的选择及研究对象
大型语料库的产生对语言学的研究起了巨大的促进作用,保证了语言研究的科学性。本文以1998年1月北大标注的新闻语料库作为语料基础,以保证语料的充足性和科学性。为了保证不使研究方向发生偏误,本文只考察语气词在新闻语料文体中的使用情况。
本文在计算机基础上,借助于语料检索软件,采用穷尽式作业,对在北大标注的1998年1月新闻语料库中的语气词进行检索,共检索出29个语气词及包含这29个语气词的所有句子,下文将对这29个语气词的使用情况进行定量分析,并进行简略解释。另外还将部分结果与刑红兵《现代汉语词类使用情况统计》(1999)的部分结果进行比较,看一下采用不同语料库结果是否有差异。
三、语气词在语料库词汇整体及虚词中的分布统计
据前贤的研究,介词、连词、助词和语气词四类构成虚词一类,属于封闭类,数量有限,但使用频繁,那么四类词具体的使用情况如何,语气词在词汇总体和虚词中是如何分布的呢?根据新闻语料库统计出的数据具体如下:
表1 介词与词汇总体、虚词和各类虚词的分布统计表
从表1可知:
1.虚词总体数量所占总词数的比例仅为0.58%,但是虚词总词次所占的比例却达到了11.54%,相比于词数所占的比例增加了近20倍左右;平均每个词的词次出现了439.80次,也是总平均词次的20倍左右。从这儿可以看出虚词的数量有限,但是使用频次很高。
2.在数量上,虚词内的连词、助词、语气词和介词四类中,语气词数量最少,共29个,占虚词总数的9.09%,词汇总体的0.05%,连词的词数最多,占了虚词总数的一半以上。而在词次方面,语气词数量也最少,每个语气词在语料库中平均出现了64.97次,占词汇总词次的0.15%;而助词使用最频繁,词次达到了73163,平均每个助词在语料库中出现了2151.85次。因此无论是从数量上还是从词次上,语气词都是最低的。
刑红兵《现代汉语词类使用情况统计》(1999)也曾统计过类似数据,但是由于采用数据库不同,数据也不同,为了比较两者的结果是否有差异,本文对其统计数据进行了重新运算整理如下:
表2 刑红兵《现代汉语词类使用情况统计》(1999)中的有关数据(整理后)
1.从量上来说,相比于表1中的数据,虚词的量得到显著地增加,从319增加到756个,比重从0.58%增加到1.51%,在虚词总数变化的同时,四类虚词的数量都有很大增长,尤其是语气词和连词的数量有比较大的变化,语气词比重显著增加,从29增加到了93个,比重从9.06%增加到12.30%,而连词比重减少了,从164增加到302,但比重从51.41%减少到39.95%。
2.从词次上说,除了语气词有较大幅度的增加外,其他词都有显著下降,语气词平均词次的增加明显,超过了介词和连词,而跃居第二位,而连词平均词次却降到最少,这说明在新闻语体中,语气词的使用显著少于其他文体,连词的使用频度要高于其它文体。
从上面这些数据都可以看出语气词在新闻语体中使用具有特殊性特点,这可能就是新闻语料库中的虚词分布与综合语料库的差别之一,探索其深层原因,应该主要是由新闻文体的特点决定的:一是新闻具有传播对象的大众性,报道的客观性、真实性的特点,这就要求新闻语言多使用通用书
文档评论(0)