- 6
- 0
- 约9.86千字
- 约 6页
- 2017-03-13 发布于四川
- 举报
CCD名词概念组成的调整与优化*
昝红英1 刘扬2 柴玉梅1 申丰山1 张坤丽1
1 (郑州大学信息工程学院,河南郑州,450052)
2 (北京大学计算语言学研究所,北京,100871)
iehyzan@
摘要 语义知识库的构建与不断改进是文本内容理解的基础。本文针对CCD名词概念数据的特点,根据当代中文真实文本信息的词汇特征,提出了CCD名词概念的优化规范以及可行的优化方法,完成了CCD名词概念的初步优化工作,使CCD名词概念中文表示的准确性和完备性得到了显著改善。
关键词:中文概念词典 语义词典优化 同义词集合 准确性 完备性
The Adjustment and Improvement
of the Noun Concepts’ Component in CCD
ZAN Hongying1 LIU Yang2 CHAI Yumei1 SHEN Fengshan1 ZHANG Kunli1
1 (College of Information Engineering, Zhengzhou University, Zhengzhou , China 450052)
2 (Institute of Computational Linguistics, Peking University, Beijing, China 100871)
iehyzan@
Abstract The Conctruction and the Improvement of Semantic Knowledge Base is the basic of Text Content Understanding. Aiming at the features of noun concepts in CCD and the words in the contemporary Chinese real text, this paper has put forward the criteria and feasible messures to improve the noun concepts in CCD. The authors have finished the elementary optimizing work to about 64000 noun concepts. It has apparently amended the precision and the completeness of CCD.
Key Words: Chinese Concept Dictionary, Improvement of Semantic Dictionary, Set of Synonyms, precision, completeness
引言
语义是思维的体现者,是客观事物在人们头脑中的反映中国科学院声学研究所Miller教授和Christian Fellbaum教授等人于20世纪80 年代初开始创建的[5,6],历时20余年并且还在不断完善之中。由于WordNet概念的形式化描述和概念之间简明的结构,目前已成为事实上的国际标准,其框架的合理性已经被词汇语义学界所公认。WordNet改变了传统词典的组织方式,根据词义而不是根据词形来组织词汇信息。WordNet通过同义词集合(Set of Synonyms, Synset)表示概念,通过概念间的关系描述英语概念之间复杂的网状语义关系,WordNet中的关系指针及其含义说明见附1。其中上位关系(hypernymy relation)是名词(或动词)概念间的主关系,另外还有一些辅助的关系(例如,名词概念间的反义关系、部分/整体关系等,动词概念间的反向假设关系、致使关系等)。
WordNet 1.6版本包含四类实词的99,642个概念节点(其中名词概念66025个、动词概念12127个、形容词概念17915个、副词概念3575个)和大约20万对语义关系,形成了一张庞大的英文概念语义网络。为了继承已有的研究成果,与国际标准接轨,北京大学计算语言
原创力文档

文档评论(0)