- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉语语义词典描写框架的新构想 - 黑龙江大学俄罗斯语言文学与文化
2010年第2期 俄语语言文学研究 2010, №1
总第27期 Russian Language and Literature Studies Serial №27
借鉴TKC的编写理论建构汉语语义词典的描写框架
蒋本蓉
(黑龙江大学,哈尔滨 150080)
提 要:语义词典的建设已成为自然语言处理的基础性工作。世界各国已开发了许多大型的语义词典、词库。本文分析了当今汉语语义词典的主要特点及不足,系统阐述了莫斯科语义学派“意思(文本”模式理论的词库——《现代俄语详解组合词典》的编写理论,借鉴其理论和方法并结合汉语自身的特点,对其内容进行了补充,提出了编写汉语语义词典的框架并编写了词条样例。
关键词:语义词典;语义元语言;支配模式;词汇函数
中图分类号:文献标识码:A
1 引言
语义词典的建设已成为自然语言处理的基础性工作。世界各国已开发了许多大型的语义词典、词库。汉语语义词典的研发经历了不断发展变化的过程,从以人为对象、以动词词典为主到以机器为对象、系统描写名词、动词、形容词等实词语义信息的语义词典。汉语语义词典的内容与语言学理论结合得越来越紧密,描写模式也日趋合理完善,在语义分析、机器翻译、信息提取等领域发挥显著作用。但是到目前为止,没有一部语义词典能够综合地反映词的语法、语义和句法属性,这是所有汉语语义词典的一个弱点。
早期的语义词典通常是以动词为描写对象的动词词典。从孟琮等编写的《动词用法词典》到基于格语法理论林杏光等编写的《现代汉语动词大词典》和鲁川的《动词大词典》,从本质上看,这些词典是基于动名搭配格式“偏重价量分析”的词典。这种描写方法不能揭示汉语的特点,因为“汉语中即使是同价动词,即使一一列举出可能的各种动名搭配格式,仍然未必能反映汉语大量的特殊句式的动词类别,如‘把字句’、‘存在句’等”(徐烈炯等 1998:15)。
董振东创建的“知网”(HowNet)的理论基础是义元分析和语义角色、语义关系的细致描述。知网的核心理论是“知识和意义寓于关系之中,关系是知识的核心,关系是知网的灵魂”(董振东等 2007:4)。知网是充分揭示词汇语义关系的知识词典,不是全面描写词的语义、句法属性或者说词的聚合关系和组合关系的词汇语义词典。知网重在揭示“知识”(即意义)、类别和“关系”,词的句法信息显得薄弱。虽然知网借助90个语义角色对表示事件类词的必要角色框架进行了细致描写,但是“知网没有涉及动词的角色变元和句法题元之间的对应关系以及句法题元在表层语句中的分布特征”(薛恩奎 2007:327)。知网只是静态地标注了动词的语义角色,没有描写动词的角色变元在句子中的具体表达方法以及使用的语义约束条件。《中文概念词典》(Chinese Concept Dictionary)也存在类似的弱点。虽然它采用26个汉语动词论元角色描述了动词的句子框架和论元角色的语义限制,但它也没有阐述动词的论元角色在句子中的具体体现。
北京大学的《现代汉语语义词典》(Semantic Knowledge-base of Contemporary Chinese,以下简称SKCC)基于配价理论和格语法相融合的“广义配价模式”(詹卫东 2000:38)以词的义项为单位系统描写其语义分类、配价数量、配价成分的语义角色和搭配的语义约束条件。SKCC的不足与上述词典类似,没有描写被释词项的句子框架(句型)及在该句型中被释词项使用的语义约束条件,即SKCC只是静态地描写被释词项的语义属性和语义限制,没有给出在动态的词与词的组合(即句子)中被释词项所具有的属性及搭配限制。此外,SKCC的语义信息描写得也不够全面。例如,动词“找”是同形词,“找A”表示“寻找”,对“主体”配价的要求是“人”,对“客体”配价的要求是“具体事物”;“找B”表示“退还”,对“主体”的要求是“人”,对客体的要求是“钱”,对与事的要求是“人”(王惠等 2006:140)。实际上“找”的许多组合,如“你找谁”,“找工作”,“找对象”(男、女朋友)的客体配价既不是“具体事物”,也不是“钱”。
语义词典应以词的义项为单位,综合描写语法、语义和句法信息。《现代俄语详解组合词典》(Толково-комбинаторный словарь современного русского языка,简称ТКС)是一部以标题词义项(词项)为对象对语法、语义和句法属性进行集成描写的综合词典。本文将以汉语为例,阐述ТКС的编写理论,借鉴TKC的理论和方法并结合汉语自身的特点,提出编写汉语语义词
文档评论(0)