- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知网知识系统描述语言
KDML知网知识系统描述语言 知网: / 摘要 本文概述了知网知识系统描述语言KDML(Knowledge Database Mark-up Language)的发展过程。 着重介绍了知网知识系统描述语言的语法规则,概念描述方式,旨在展示知网知识系统描述语言的结构,使知网的使用者对知网知识系统描述语言有更加清晰的认识,从而能为他们利用知网知识系统进行自然语言处理提供更好的帮助。 引言 知网知识系统描述语言,英文名称为Knowledge Database Mark-up Language 即KDML。 知网知识系统描述语言是一套崭新的知识描述规范体系。知网认为对于概念的描述应该着力体现概念与概念、概念的属性与属性之间的相互关系,因此,知网知识库对于概念的描述必然是复杂的。 对于概念的描述既有概括性的、一般性的描述,也会有因不同的类别而引起的细节性的描述,由此而引发概念描述的一致性和准确性的问题。为了确保概念描述的复杂度、一致性和准确性,我们设计了一种知识描述规范体系—知网知识系统描述语言(KDML)。 经过对中英文两种语言各8 万多概念的描述,证明它(1)有很强的描述能力;(2 )便于对意义的计算;(3 )它直观、有较好的可读性。 1. 总规定 (1) 任一概念的描述都以DEF= 为开始。任一概念中出现的所有义原或符号必须是在知网的Taxonomy 中定义的义原或符号或者由知网知识系统描述语言所规定的特定标识符。 (2) 概念描述中的第一个义原必须指出该概念的最基本的意义,并用事件、实体、属性和属性值这四类义原中的一个标注出来。 (3) 对于简单概念直接标注该概念的意义。 (4) 利用动态角色与特征来标注复杂概念。 (5) 属性类概念必须标明它的宿主。 (6) 整体部分类型的概念必须标明该部分的整体。 (7) 概念描述中定义的特性至少是一个,但也可以是多个,数量没有限制,只要内容是合理的且形式是合乎规范的就可以了。 2. KDML 中的特定标识符 在知网知识系统描述语言中允许使用以下7 种标识符,它们都是英文字符,具体见下表。 大括号 每一个完整的概念都必须用一对大括号括起来。 左括号表示对一个概念描述的开始,右括号表示对一个概念描述的结束,左括号和右括号必须成对出现,也就是说它们必须前后匹配。 大括号的嵌套关系用来表示概念与概念以及概念的属性与属性之间的层次和修饰关系。 W_C=打 G_C=V E_C=~球,~网球,~篮球,~羽毛球,~牌,~扑克,~麻将,~秋千,~太极拳,球~得很棒 W_E=play G_E=V E_E= DEF={exercise|锻练:domain={sport|体育}} 冒号 在相匹配的一对大括号中,冒号后面的所有内容都是对冒号前面的概念的具体描述,其中包括这个概念所具有的属性以及各种关系 W_C=洗衣 G_C=V E_C= W_E=wash clothes G_E=V E_E= DEF={wash|洗涤 : patient={clothing|衣物}} 等号 表示一个动态角色或特征所具有的具体的值。 等号前面的内容为动态角色或特征,并且它必须是知网Taxonomy 的Event Role & Features 中的内容。 等号后面的内容为该动态角色或特征所具有的具体的值,这个值可能是一个简单的概念,也可能是一个复杂的概念。 一个动态角色或特征可以只有一个值,也可以有多个值,当它具有多个值的时候,这些值之间没有其他分割符。 等号 W_C=人群 G_C=N E_C= W_E=crowd G_E=N E_E= DEF={human|人 : quantity={mass|众}} W_C=东北 G_C=N E_C=~风,~方向,~部,~角,~面,朝向~,有点偏~ W_E=northeast G_E=N E_E= DEF={direction|方向 : modifier={east|东}{north|北}} 逗号 当一个概念具有多个属性或者关系时,使用逗号来区分各个不同的属性或关系。 当对一种属性或关系进行的描述结束时,使用逗号表示这种结束。 它与右括号的区别在于,右括号表示的是对一个概念描述的结束,而逗号则是对一个概念中某个属性或关系的描述的结束。 W_C=出入证 G_C=N E_C= W_E=pass G_E=N E_E= DEF={document|文书: {GoInto|进入: instrument={~}} , {GoOut|出去: instrument={~}}} 分号 当一个概念是由若干个概念组合而成的组合型复杂概念时,使用分号分割各个不同的概念。 分号分割的各个部分必须是独立的完整的定义。 W_C=才智 G_C=N E_C= W_E=ability and wisdom G_
文档评论(0)