SUMO——顶级本体的介绍与启示.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SUMO——顶级本体的介绍与启示.doc

SUMO——顶级本体的介绍与启示 图书馆理论与实践海外链接 ●王红,丁媛,张剑2 (1.大连理工大学图书馆,大连116024;2.中国科学院文献情报中心,北京100080) SUMO顶级本体的介绍与启示 [关键词]本体;顶级本体;SUMO [摘要]近年来,人们越来越多地来研 究本体以及语义网.顶级本体是高层的独立于 领域的本体,它使完全相异的系统可以使用一 个共同的知识库.顶层本体是各领域本体的基 础.文章介绍了顶层本体项目——suMO产生 的背景及目前发展的状况;分析了其特点,并 且对其创建方法,结构设计,顶层结构,应用 与服务等进行了阐述. [中图分类号]G35 [文献标志码]A [文章编号]1005—8214(2007)03—0096—02 1顶级本体 1.1概念 顶级本体是高层的独立于领域的本体,它使完全相异 的系统可以使用一个共同的知识库,并且从顶级本体可以 衍生出领域本体.顶级本体通常表达常识性概念,即人类 对世界的基本认识.顶级本体的概念主要局限在基本的, 普遍的,抽象的和哲学上的概念.标准顶级本体也称为基 本本体或通用本体.[13 1.2目的 顶级本体标识和定义了通用的概念,它们的目的是充 当: .更多领域本体的基础 .领域本体合成的框架 .包含同样领域但是使用一个不同的词表的多样本体 转换的指南 2SUMO 2.1产生背景 网络资源迅猛增长,但由于Web信息资源没有经过规 范的标引和系统的组织,采用关键词检索可以说是一种无 奈的选择,而它却存在着很多的缺陷,如:检索需求的表 达不清楚,大多数的普通用户都不能找出合适的词汇来把 自己的检索需求表达清楚;检索过程是词形匹配而非词义 匹配,一义多词(同义词)使检全率难以保证,一词多义 (多义词)导致检出无关的文献,使检准率降低.西文还 有词型变化的问题(如时态,单复数等).最主要的原因 是由于人类的语言比较自由随意,可以表示任何人所说的 任何话,但是计算机所能够理解和表示的事物是非常有限 的,另外.许多人类语言的术语和结构是模糊的,不清楚 的,导致许多语言的特定含义对计算机来说是无用的.[23 ? 96? 在计算机科学,人工智能,哲学,图书馆学和语言学 等领域都试图满足综合性的,形式化本体的需求,所有这 些领域都尝试着创建对实体(entity)或事件进行标准化的 描述与词汇定义.然而没有一个领域能够真正做到,同时 领域之间也没有达成协议.但是越来越意识到对大型,公 共可免费获得的本体的强烈需求.一群来自于工程,哲 学,信息科学等领域的研究者组成了标准顶级本体 (standardupperontology,简称为SUO)研究组.研究组 于2000年l0月向IEEE提交了项目申请,并于2000年l2 月获准成立了IEEEPI600.1工作组,即SUO工作组.【3] 工作组的任务是详细定义一个顶级本体的语法和语义,以 提供一个对通用术语的定义和下层领域本体的基础结构. 预计该研究最终提出的顶级本体包含1000到5000个术 语,每个术语大概包括l0条陈述. 2.2现状概述 SUMO(suggestedUpperMergedOntology)最初由LanNiles 和AdamPease开发,现在由TeknowledgeCorporation维护.b】 SUMO包括人类认知方面的类目和现实描述的类目.SUMO 合并现有的顶级本体而成,被合并的本体包括:Ontolingua 服务器上可获得的本体,JohnSowa开发的顶级本体, ITBM—CNR开发的本体,Russell和Norvig开发的顶级本体 和各种拓扑理论.SUMO是一个轻量级的本体.它所包括 的概念和公理都是以一种能被大多数用户能够理解掌握的 方式来表示.[61 2.2.1特点[53 .目标是实现数据的互操作,信息检索,自动推理和 自然语言处理. .知识表示语言是SUO—KIF语言(美国国家标准KIF 格式的简化版).SUMO周期性地自动地被翻译成LOOM, OWL,DAML,XML和Prot6g6格式. .SUMO可以按GNU公共许可协议使用,提供联机浏 览. .SUMO中的概念是完全公理化的. .与整个wordnet建立映射. .具有语言生成模板,可以转化成印度语,汉语,意 大利语,德语,捷克斯洛伐克语和英语. .有支持浏览和编辑的工具. .最大的免费可得的本体,有20000个术语和60000 条公理. 2.2.2SUMO的创建方法(Methodology) SUMO的创建步骤: (1)确认所有没有许可限制的顶级本体的内容,这些 图书馆理论与实践海外链接 内容包括ontolinguaserver可得的本体,JohnSowa的顶级本 体,ITBM—CNR开发的本体,Russell和Norvig的顶级本 体,Jame

文档评论(0)

cai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档