- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语料库动宾复合词属性考察及其词汇化程度研究
基于语料库动宾复合词属性考察及其词汇化程度研究摘 要:本文以《现代汉语词典》中所有动宾复合词为分析对象。首先在数据库中从“儿化、轻声、词性、结构、是否是离合词、能否带宾语、《辞源》中是否已有、义项数”等八个方面对所有动宾复合词的属性进行了逐词分析。然后,从“语音、语义、结构、语法”四大层面对这些属性进行了量化统计和性质判断。在对比分析的基础上,笔者得出结论:现代汉语中不同动宾复合词的词汇化程度是不同的,整体来看,现代汉语中动宾复合词的词汇化程度比较低。同时从历时角度提出了动宾短语词汇化为动宾复合词六阶段的设想。
关键词:语料库 汉语 动宾复合词 属性 词汇化
动宾复合词是现代汉语词汇系统的重要组成部分,其中双音节动宾复合词①占主体。本文的研究以双音节动宾复合词为对象,多音节动宾复合词暂不涉及。
“词汇化”是指比词大的句法单位随时间推移,逐渐凝结为结构不可自由分离、意义具有整体性的词汇单位的过程和现象。本文所说的词汇化特指动宾短语凝结为动宾复合词的过程和现象②。
现代汉语平面的动宾复合词从历史来源看,很大一部分由动宾短语衍化而来。在共时平面上表现为:或改变词性,如“将军、著名”;或变为及物动词,如“得罪,注意”;或结构凝固,不可扩展,如“阅兵、称谢”;或结构可以有限扩展,意义具有整体性,如“逼宫、拆台”等等。动宾式双音节复合词在共时层面呈多样性,这种多样性是词汇历时演变在共时平面上的表现,应该从历时角度寻找原因。
动宾短语发展为动宾复合词是古汉语的以单音节词汇为主发展到现代汉语的以双音节词汇为主的具体表现。动宾类词汇化发展的不同阶段在现代汉语词汇中均有表现,通过分析现代汉语动宾类词语的特征,可以推测动宾短语发展到动宾复合词的发展历程和不同阶段。
一、研究对象和方法
本文以双音节动宾复合词为研究对象,多音节动宾复合词暂不涉及。具体选材范围设定为《现代汉语词典》(下文简称《现汉》)中的双音节动宾复合词。首先,我们对《现汉》中双音节动宾复合词进行了穷尽性的统计。选取标准是:动素和宾素间有“支配和关涉”关系。共收集到动宾复合词6826个。将这些词放入Access数据库中,然后对这6826个动宾复合词的属性从多方面、多维度进行分析。分析角度有8个:是否轻声;词性;是否离合词;义项数量;《辞源》中是否已经存在;能否带宾语;内部结构;是否儿化。根据对每类属性的统计结果,探求动宾复合词各种属性的数量和比例。在此基础上,总结不同性质双音节动宾复合词在共时层面上的分布规律,在对量化特征进行分析的基础上,进一步探讨不同类型双音节动宾复合词的性质。
我们注意到,现代汉语异形词作为两个词条都收入了《现汉》,但实际上只有一种解释。异形词尽管词形不同,但实际上是同一个词,我们的语料库中只收入一个。在操作中,我们根据《现汉》对两个词形释义地点③的倾向性,只取其正形。具体做法是,取有义项解释的词形为正形,未做具体解释的为异形。如:“诿过:推卸过错。”“委过:见诿过”;“诿罪:推卸罪名。也作委罪”“委罪:同诿罪。”语料库收集动宾复合词时,只取“诿过,诿罪”,不取“委过,委罪”。
另外,动宾复合词有的有儿化现象。儿化的词,有的在表意上与非儿化没有区别,只是习惯。有的则有使宾素名词化的作用,如:打鸣儿、打晃儿、打奔儿、傍黑儿、拔尖儿、加塞儿、捡漏儿、打杂儿、抓空儿、绕弯儿、撒欢儿、没准儿等。儿化部分并不自成音节,我们按照双音节动宾复合词标准收词时,也收入了这些儿化的动宾复合词。
二、动宾式复合词共时层面的分析
通过对语料库中6826个动宾复合词属性的逐一分析并对各项属性进行统计,可以初步得到这样一些数据:动宾复合词总量6828个;其中轻声词57个,占0.83%;《现汉》与《辞源》共有词1712个,占25.08%;离合词3383个,占49.56%。
从包含的词类看:动词5749个,占84.22%,加上包含动词的兼类词共6192个,占90.71%;名词179个,占2.62%;形容词335个,占4.90%;副词79个,占1.10%;兼类词484个,占7.10%;其他词4个,占0.06%。
下面我们从语音、语义、结构、语法四个方面对动宾复合词进行分析。
(一)语音层面的分析
动宾复合词语音层面的研究,主要研究了轻声词。《现汉》6826个动宾复合词中,标出轻声音节的,共有57个,占动宾复合词总量的0.83%,所占比例很小。我们对轻声词在语法上进行了如下分类:
n(名词):枕头、裹脚、紧身儿、点心、散水、管家、干事、垫脚、说口、兜肚、开山、滴水、扳指儿、扳手、拉手、笼嘴、笼头、下场、顶针、下水、裹腿、说法、插关儿、陪客、包头、盖火、扶手、盖头、走水、抬肩、把手、执事、搭腰、把势、填房、起火(36个,占轻声词的63.1
文档评论(0)