一个现代汉语语义知识库的研究和实现.pdfVIP

一个现代汉语语义知识库的研究和实现.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一个现代汉语语义知识库的研究和实现.pdf

一个现代汉语语义知识库的研究和实现 陈群秀 清华大学计算机科学与技术系智能技术与系统国家重点实验室,北京 100084 E-mail:cqx@s1000e.cs.tsinglIua.edu.cn 摘要:本文首先提出汉语词汇语义知识表示的一种解决方法:对动词、形容词从格框架角度用论旨网格描 述其句法、语义、语用知识,对名词从槽关系角度用槽关系联想表达式(槽类型、槽序)描述复杂定语与被 修饰的中心词的语义关系,对名词还从语义场角度描述上下位语义关系。然后。本文着重介绍清华大学计 算机系与中国人民大学,北京语言大学、北京青年政治学院凝同承担的四个语言工程“现代汉语述语动词 机器词典”、。现代汉语述语形容词机器词典”,。现代汉语名词槽关系系统”、“信息处理用现代汉语语义分 类词典”的研究和实现情况。最后,论文还建立了现代汉语语义知识库平台. 关键词:现代汉语述语动词机器词典:现代汉语述语语形容词机器词典:现代汉语名词槽关系系统:信息 处理用现代汉语语义分类词典:论旨网格方法:槽关系表示方法:槽类型:槽序:槽关系联想表达式 l前言 目前。世界上各国学者十分重视语言信息处理的知识资源的建设,知识包括词汇学知识、 句法学知识、语义学知识、语用学知识乃至常识方面的知识,核心问题是语义学知识。相比 而言.句法分析理论和技术(无论是对外语还是对汉语)发展得比较成熟和完善,语义学则 是难度较大、起步较晚的一个薄弱环节,空白点更多。特别是面向机器处理的语义学研究, 国内外起步时问均不长。汉语缺乏屈折变化,是意合语言是语义型语言.对语义的依赖更大, 句法分析对句子的贡献比英语等语言要小,语义分析对汉语机器理解尤为重要。因此研究面 向机器处理的汉语语义知识表示更具有重大意义。在语义知识中词汇意义占很重要的位置, 是驾驭整个语义系统的基础。 在对述语动词、述语形容词、名词词组作了大量的分析和研究的基础上,我们决定:对 述语动词、述语形容词用论旨网格方法、从词法、句法、语义、语用多角度全面描述动词和 形容词的信息,重点是语义信息;对名词的定语从语类、语序、定语与中心语的语义关系(槽 类型、槽序)等多角度进行描述;同时对名词还从分类的角度描述名词的上下位关系。即: 对汉语述语动词、述语形容词从格框架角度用论旨网格方法描述其语义、语用知识:对汉语 名词的定语从槽关系角度以槽关系为主、以语类、语序为辅、用槽关系联想表达式(槽类型 和槽序的表达式)描写复杂定语与被修饰的中心名词的语义关系;对名词还从语义场角度(即 义类角度)描述上下位语义关系和语义特征。基于此,清华大学与中国人民大学、北京语言 大学、北京青年政治学院共同承担了“现代汉语述语动词机器词典”、“现代汉语述语形容词 机器词典”、“现代汉语名词槽关系系统”、。信息处理用现代汉语语义分类词典”四个语言工 程的研究和实现的项目。本文下面将着重介绍这四个语言工程的研究和实现情况。 一172— 2现代汉语述语动词机器词典的研究和实现 清华大学和中国人民大学正是抓住动词词典这个关键中的关键,自1994年开始以“现 代汉语述语动词机器词典的研究和建立”为题开展合作,对现代汉语常用的7800个动词的 10000个义项作详细描述,用计算词典方法建造一部信息丰富、结构合理的机器可循词典 (MachineTractable 者和科技工作者使用。 现代汉语述语动词机器词典的特点是:以原则参数语法作为理论指导,以论旨网络 function)”作详尽描写:从论旨角色语义约束的角度,建立汉语句词性概念的分类体系 据的传统词典学编辑方法同主要以从机贮语料库中获取的大量例证为依据的计算词典学编 辑方法结台起来.以使动词机器词典的研究和建立真正立足在丰富和客观的语言事实基础 上;除了构造一部现代汉语述语动词典外.还建立一个功能齐全的软件支撑环境。 现代汉语述语动词机器词典工作单描述的信息包括“词形”、“拼音”、“动词类型”、“论 元数目”、“义项数目”、“义项序号”、“释义”等词汇信息.包括论旨模式的“基本式l”及 “句例”、“变换式I”及“句例”、“基本式2”及“旬例”、“变换式2”及“句例”、“基本 式3”及“句例”、“变换式3”及“句例”、“论旨名称”、 “语类”、“句法功能”、“语义分 类”、“语义特征”、“论旨标记”、“论旨实例”等论旨属性(语义、句法、语用

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档