- 2
- 0
- 约5.91千字
- 约 47页
- 2019-06-19 发布于广东
- 举报
本体在生物信息学中的应用 An ontology for bioinformatics applications 文章内容 摘要和引言 关于描述逻辑DL和本体 GRAIL(描述逻辑指导模型) 语言 TAMBIS生物信息学本体 当前生物信息学本体的研究现状 生物信息学本体的应用 展望 摘 要 动机:生物学本体提供了一个生物学概念模型,它可以用来为很多数据存储,检索和分析工作形成一个语义框架。 这样一个语义框架可以用来支持一系列重要的生物信息学工作。 结果:这篇文章提供了对描述一系列生物信息学概念的本体的一个综述。现有的文章描述了用来表达本体和讨论本体设计和组织的机制,它对于维持一大批概念和它们关系的一致性是至关重要的。 可用性:使用这里描述TAMBIS系统可以通过网络访问:http://img.cs.man.ac.uk/tambis ,完整的模型也可以从上面的网络URL获得。 引言 生物学是一门基于知识的学科。在生物学中,我们手边的许多工作如数据预报和数据解释都是用现有的知识进行数据比较。 例如:从序列中预测蛋白质功能。 基于知识的和基于公理(axiomatic)的学科之间的差别就在于过去的经验在知识基础中所扮演的角色差别。 本体是描述概念和概念之间关系的系统. 在知识表示领域的研究中,一个本体必须有反映数据所必要的“明确”视角,例如蛋白质的概念。蛋白质的概念显然是与蛋白质有关联的一个“访问号码”对应,而这个访问号码是从序列数据库中检索信息的关键字。但是这个访问号码或许与真实蛋白质的属性是没有任何意义的。 在本论文中,我们已经研究了一个特定形式的知识表达系统,描述逻辑(DLs),并认为(i)描述逻辑是灵活的强大的,能够以一致的和原则的方式捕捉和分类生物概念。(ii)DLs 可以用于构建本体,可以从生物数据中进行推论. 关于描述逻辑DL和本体 传统上,本体一直是利用静态模型表示,这些可能有助于在纯粹的术语或句法学层次上交换知识,并且可以依赖不同的解释-在模型中建模人独有视角的关系。如果我们要共享知识,那么就需要有清楚的语义。 “框架表示”提供了获取概念和它们之间关系的准确定义的框架。这个框架形式已经在模拟EcoCyc的生物数据中利用。并且已经定义了由框架系统提供服务的专门接口的描述。然而这个表示是静态的,并且是要声明所有的包容,“声明”是层次类表示,这是由建模者做的,而不是系统从描述逻辑中推导出的。 描述逻辑DL(Description Logic)是一个关于知识表示语言的例子,它除了提供关于领域陈述性知识的语言之外,还提供了一个允许对这些知识推理的分类器。利用DL获得的信息可以被分类成为丰富层次的概念和它们的关系。DL是合成的和动态的,相当多地依赖于分类、包容(subsumption)、一致性检索和查询服务器的理念。这意味着可能从现有的概念中构建新概念,并且自动准确地放到格子中(lattice)。 DL至今还没有用于生物领域,但是已经用在知识库的从文献中自动检索信息,和已经大量用于非生物领域包括医学应用例如GALEN项目。GALEN项目选择了Dl作为表示语言。其合成的特性和动态的推理服务分类也是适合生物学领域建模的理想工具。 GRAIL(描述逻辑指导模型) 语言 GRAIL语言是“KL-ONE”系列中的DL,开发它的最初动机是为了模拟医学术语系统,为了支持临床用户界面。现在在构建生物学术语也有用到它的,例如TAMBIS本体。 DL以概念(类),角色(关系),和个体(对象)为领域术语建模。领域是个体的集合,概念是共享共同特征的个体组的描述。角色模仿在个体或属性之间的关系。那么利用递归的术语构造器(constructor)可以构建合成的概念描述。个体是明确概念的一个实例,一对个体是明确角色的实例。在GRAIL中所有角色都是双向的。 例如蛋白质是一个个体类(所有蛋白质),并以此模仿一个概念。蛋白质可能有合成物,例如有“基序(Motif)”这个合成物,那么我们可以通过二元角色“hasComponent (有成分)”表示这个蛋白质。于是我们形成了一个新的概念,可以说“hasComponent Motif”(蛋白质有基序成分),或说“ishasComponentOf Protein”(是有“modif”成分的蛋白质)。 一个GRAIL模型是由三部分组成:它们是“声明(assertions)”,“概念-形成”的运算和推理服务,和“批准(sanction)” 声明 一个模型包含有“要素”概念定义的收集物以及相随角色的收集物。“要素”概念定义是简单的、原子概念(例如基序Motif
原创力文档

文档评论(0)