- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[CCD名词概念组成的调整与优化
CCD名词概念组成的调整与优化*
昝红英1 刘扬2 柴玉梅1 申丰山1 张坤丽1
1 (郑州大学信息工程学院,河南郑州,450052)
2 (北京大学计算语言学研究所,北京,100871)
iehyzan@
摘要 语义知识库的构建与不断改进是文本内容理解的基础。本文针对CCD名词概念数据的特点,根据当代中文真实文本信息的词汇特征,提出了CCD名词概念的优化规范以及可行的优化方法,完成了CCD名词概念的初步优化工作,使CCD名词概念中文表示的准确性和完备性得到了显著改善。
关键词:中文概念词典 语义词典优化 同义词集合 准确性 完备性
The Adjustment and Improvement
of the Noun Concepts’ Component in CCD
ZAN Hongying1 LIU Yang2 CHAI Yumei1 SHEN Fengshan1 ZHANG Kunli1
1 (College of Information Engineering, Zhengzhou University, Zhengzhou , China 450052)
2 (Institute of Computational Linguistics, Peking University, Beijing, China 100871)
iehyzan@
Abstract The Conctruction and the Improvement of Semantic Knowledge Base is the basic of Text Content Understanding. Aiming at the features of noun concepts in CCD and the words in the contemporary Chinese real text, this paper has put forward the criteria and feasible messures to improve the noun concepts in CCD. The authors have finished the elementary optimizing work to about 64000 noun concepts. It has apparently amended the precision and the completeness of CCD.
Key Words: Chinese Concept Dictionary, Improvement of Semantic Dictionary, Set of Synonyms, precision, completeness
引言
语义是思维的体现者,是客观事物在人们头脑中的反映。人们在理解文本内容时常常是通过分析其中关键词语的语义概念及其语义关系来得到篇章语义的。为了达到一定的效果,人们对同一个概念往往换用不同的词来表现,一词多义和多词一义造就了自然语言的丰富性与灵活性,同时也给文本内容的理解造成了困难。对语言的理解主要是语义、概念的把握,针对中文文本词语意合的特点,基于词汇的语义概念的研究有着深远的意义,构建内容丰富的语义词典或语义知识库,能够为消歧等语义分析工作提供一定的依据。
语义知识库是计算机“理解”语言内容的基础,早在二十世纪初,一些哲学家就开始了语义的形式化研究[1,2]。进入20世纪80年代,自然语言的形式语义学和计算语义学开始走入计算语言学,这些研究的基础假设是人们对概念、语义、知识的理解有很大的相似性。20世纪80年代中后期,人们开始面向机用的语义知识库方面的研究,目前这方面的主要成果有Princeton大学的WordNet、California大学Berkeley分校的FrameNet以及微软公司的MindNet等,它们主要是以英语为描述对象,不便于中文语义的分析应用;目前中文方面的语义知识库有中科院语言信息中心的知网(HowNet)[7]、中国科学院
您可能关注的文档
最近下载
- 政论型电视专题政论片.ppt VIP
- 新版GCP临床试验伦理规范培训考试题一套 .pdf VIP
- 新编高等数学(理工类)第一章 极限与连续.ppt VIP
- 13J104 蒸压加气混凝土砌块、板材构造(OCR).pdf VIP
- 2024版思想道德与法治专题1担当复兴大任成就时代新人.pptx VIP
- 章绍同《鼓浪屿狂想曲》.pdf VIP
- UG机械设计实例教程 第2章 曲柄滑块机构建模与运动仿真.ppt VIP
- 2025年最新人教版小学二年级数学上册教学计划及进度表(新课标,新教材).docx
- 2024-2025学年小学道德与法治统编版(2024)三年级上册教学设计合集.docx
- 河道整治及生态修复工程监理细则(88页)_最新版.pdf VIP
文档评论(0)