关于汉语语素若干问题再思考.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于汉语语素若干问题再思考

关于汉语语素若干问题再思考   [内容摘要] 语素是最小的语音语义结合体,是最小的语法单位。本文对与语素相关的一些问题进行了较为深入地探讨,对语素的性质、语素的构词能力、划分语素的标准等问题进行了讨论,并提出了一些自己的看法。   [关 键 词] 语素;构词;汉字。   [作者简介] 占 勇,文学博士,深圳大学中文系讲师,主要从事汉语语言学、中文信息处理研究。      众所周知,语素是最小的音义结合体。作为最小的语法单位,语素的主要功能是构词。关于语素的名称,学界还存在着另一种说法――“词素”。本文采用“语素”,原因有两点:一是因为语素概念使用得更为普遍,更容易接受;二是我们十分赞同吕叔湘(1979)所说,“比较起来,用语素好些,因为语素的划分可以先于词的划分,词素的划分必得后于词的划分,而汉语中词的划分是问题比较多的”①。尽管人们对语素的定义和功能的看法没有分歧,但是在语言教学实践中,我们发现一些与“语素”有关的问题,诸多教材或语焉不详,或含糊不清。我们对这些问题进行了认真思考,提出了一些不太成熟的看法。现不揣浅陋,以抛砖引玉,就教于方家。      一、语素才是基本构词单位   汉语文本上最明确的单位是汉字。从形式上来看,词确实是由汉字构成的,但词的构成成分绝不能简单地认为是汉字。“字”容易分辨和确认,可以说是一种“天然”单位,但是“字”不是一级语言单位,不能说词是由“字”构成的,只能说词是由“字”记录的②。黄昌宁(2006)从中文信息处理的角度,提出了一种新的分词思路,但这种“由字构词”的说法似乎很难让人接受③。汉字只是记录语言的书写符号,并不是构词单位,只有语素才是构词单位。如果将二者混为一谈,势必会造成很多的问题。由于汉语大量单音词的存在,单个字、语素和词都是同一的,这样就造成了身份难以厘清,有人误以为词是由字构成的,而把字当成构词的基本单位。   语素是构词单位,并不意味着能够构词的只有语素。因为语言规则使用上具有递归性,词自身同样可以参与构成更高层次的词,这本身并不矛盾。词可以别的语素构成新词,并且参与构成更高层次单位的词本身仍然是词,没有“降格”成为语素之说。我们并不认同葛本仪(1988)的观点④。例如,“市场”是复合词,它可以再和语素“化”组合,构成“市场化”这个新词,“市场”这个词本身并没有改变,进行语义理解时仍然是把它作为一个整体,我们觉得没有必要再赋予“市场”一个新的身份――“词素”,“降格”之说似乎没有必要。简而言之,就是词本身可以参与造词,不仅仅限于语素造词。      二、计算构词能力要以语素为单位   前面说过,语素是最小的意义结合体,语素是基本的构词单位。研究汉语构词时必须以语素为基本单位,不能以汉字为单位。但是字和语素不加区分地混淆使用的情况经常出现,例如,前人运用下面的公式来计算汉字的构词能力:      WFP(c) = count(含c的多字词)/count(c)   WFP(c) 为汉字字符C的构词能力      我们发现,这个公式并不十分科学,因为它没有正确区分汉字和语素。利用它计算出来的结果并不精确,只能反映一种倾向性。准确地说,这种统计只是“字”的使用频率,并非这个“字”作为语素的构词能力,统计出来的结果存在着误差。我们知道,字形和语素并非一一对应的,仅靠统计某个“字”的使用频度不能准确得到该“字”作为语素的构词能力。例如,文本统计中“的”字所占的比例是最高的,占4%左右。这是由于现代汉语中“的”作为虚词使用频率非常高所致,并不能因此认为“的”构词能力强,其实“的”的构词能力非常弱⑤。又如,“爱斯基摩人”这个词里面一共有5个字,如果按字来计算构词能力,“爱”“斯”“基”“摩”这四个字构词数量都增加了一次,这肯定是不正确的。类似的计算夸大了它们的构词能力。“爱斯基摩”只是音译用字,整体作为一个语素而存在,与它本身四个字本身所代表的语素是不相关的。因此,按“字”来统计语素的构词能力必然存在着一些误差。   再如,前缀“阿”,可以加在“数词、亲属名词或人名、姓”前构成一个名词:      阿三、阿大、阿四、阿八、阿五……(加在数字前面)   阿姨、阿婶、阿公、阿爸、阿妈、阿哥、阿姐、阿妹、阿奶……(加在表示亲属名词的前面)   阿红、阿华、阿王、阿赵、阿江……(加在姓或人名的前面)      如果计算词缀“阿”的构词能力,应该有多少呢?因为“阿”具有动态生成新词的能力,随时都可能产生新词,其数量之大,恐怕很难统计出来。由于“阿”构成的大量词汇根本没有办法全部收入词库,没有办法统计。如果我们依据某一个词库,简单地计算某个字的构词能力,对于词缀来说,意义并不大。   另外,“阿”这个字形可以用来表示多个语素,除了表示前缀读音为ā以外,

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档