- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SUMO——顶级本体的介绍与启示.doc
SUMO——顶级本体的介绍与启示
图书馆理论与实践海外链接
●王红,丁媛,张剑2
(1.大连理工大学图书馆,大连116024;2.中国科学院文献情报中心,北京100080)
SUMO顶级本体的介绍与启示
[关键词]本体;顶级本体;SUMO
[摘要]近年来,人们越来越多地来研
究本体以及语义网.顶级本体是高层的独立于
领域的本体,它使完全相异的系统可以使用一
个共同的知识库.顶层本体是各领域本体的基
础.文章介绍了顶层本体项目——suMO产生
的背景及目前发展的状况;分析了其特点,并
且对其创建方法,结构设计,顶层结构,应用
与服务等进行了阐述.
[中图分类号]G35
[文献标志码]A
[文章编号]1005—8214(2007)03—0096—02
1顶级本体
1.1概念
顶级本体是高层的独立于领域的本体,它使完全相异
的系统可以使用一个共同的知识库,并且从顶级本体可以
衍生出领域本体.顶级本体通常表达常识性概念,即人类
对世界的基本认识.顶级本体的概念主要局限在基本的,
普遍的,抽象的和哲学上的概念.标准顶级本体也称为基
本本体或通用本体.[13
1.2目的
顶级本体标识和定义了通用的概念,它们的目的是充
当:
.更多领域本体的基础
.领域本体合成的框架
.包含同样领域但是使用一个不同的词表的多样本体
转换的指南
2SUMO
2.1产生背景
网络资源迅猛增长,但由于Web信息资源没有经过规
范的标引和系统的组织,采用关键词检索可以说是一种无
奈的选择,而它却存在着很多的缺陷,如:检索需求的表
达不清楚,大多数的普通用户都不能找出合适的词汇来把
自己的检索需求表达清楚;检索过程是词形匹配而非词义
匹配,一义多词(同义词)使检全率难以保证,一词多义
(多义词)导致检出无关的文献,使检准率降低.西文还
有词型变化的问题(如时态,单复数等).最主要的原因
是由于人类的语言比较自由随意,可以表示任何人所说的
任何话,但是计算机所能够理解和表示的事物是非常有限
的,另外.许多人类语言的术语和结构是模糊的,不清楚
的,导致许多语言的特定含义对计算机来说是无用的.[23
?
96?
在计算机科学,人工智能,哲学,图书馆学和语言学
等领域都试图满足综合性的,形式化本体的需求,所有这
些领域都尝试着创建对实体(entity)或事件进行标准化的
描述与词汇定义.然而没有一个领域能够真正做到,同时
领域之间也没有达成协议.但是越来越意识到对大型,公
共可免费获得的本体的强烈需求.一群来自于工程,哲
学,信息科学等领域的研究者组成了标准顶级本体
(standardupperontology,简称为SUO)研究组.研究组
于2000年l0月向IEEE提交了项目申请,并于2000年l2
月获准成立了IEEEPI600.1工作组,即SUO工作组.【3]
工作组的任务是详细定义一个顶级本体的语法和语义,以
提供一个对通用术语的定义和下层领域本体的基础结构.
预计该研究最终提出的顶级本体包含1000到5000个术
语,每个术语大概包括l0条陈述.
2.2现状概述
SUMO(suggestedUpperMergedOntology)最初由LanNiles
和AdamPease开发,现在由TeknowledgeCorporation维护.b】
SUMO包括人类认知方面的类目和现实描述的类目.SUMO
合并现有的顶级本体而成,被合并的本体包括:Ontolingua
服务器上可获得的本体,JohnSowa开发的顶级本体,
ITBM—CNR开发的本体,Russell和Norvig开发的顶级本体
和各种拓扑理论.SUMO是一个轻量级的本体.它所包括
的概念和公理都是以一种能被大多数用户能够理解掌握的
方式来表示.[61
2.2.1特点[53
.目标是实现数据的互操作,信息检索,自动推理和
自然语言处理.
.知识表示语言是SUO—KIF语言(美国国家标准KIF
格式的简化版).SUMO周期性地自动地被翻译成LOOM,
OWL,DAML,XML和Prot6g6格式.
.SUMO可以按GNU公共许可协议使用,提供联机浏
览.
.SUMO中的概念是完全公理化的.
.与整个wordnet建立映射.
.具有语言生成模板,可以转化成印度语,汉语,意
大利语,德语,捷克斯洛伐克语和英语.
.有支持浏览和编辑的工具.
.最大的免费可得的本体,有20000个术语和60000
条公理.
2.2.2SUMO的创建方法(Methodology)
SUMO的创建步骤:
(1)确认所有没有许可限制的顶级本体的内容,这些
图书馆理论与实践海外链接
内容包括ontolinguaserver可得的本体,JohnSowa的顶级本
体,ITBM—CNR开发的本体,Russell和Norvig的顶级本
体,Jame
您可能关注的文档
最近下载
- 川白芷采收及产地初加工技术规范.pdf VIP
- 2025年广西专业技术人员继续教育公需科目(二)答案.docx VIP
- 《思想政治教育方法论》PPT课件 2.第三章 课件 (有修改)第三章《思想政治教育方法的继承与改革》.ppt VIP
- 微电网控制系统及储能产品应用.ppt VIP
- 肉制品生产日常监管及风险控制.pptx VIP
- 建筑知识题库.xlsx
- 《思想政治教育方法论》PPT课件 2、第十四章 PPT课件 PPT.pptx VIP
- 中南大学青年长江候选人贺治国.pdf VIP
- 2025年河南高考卷--生物真题(带解析).docx VIP
- 金域医学公司研究报告:医疗服务业中游,ICL龙头金域医学行稳致远.docx VIP
文档评论(0)