本體在生物信息学.pptVIP

下载本文档

4
0
约4.29千字
约 47页
2017-04-23 发布于上海
举报
版权申诉

本體在生物信息学.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

本體在生物信息学

本体在生物信息学中的应用;文章内容;摘要;引言;传统的个人预测能力无法应对越来越多的知识基础利用计算机工具辅助生物学家构建生物分子学术语本体 ; 本体是描述概念和概念之间关系的系统. 在知识表示领域的研究中，一个本体必须有反映数据所必要的“明确”视角，例如蛋白质的概念。蛋白质的概念显然是与蛋白质有关联的一个“访问号码”对应，而这个访问号码是从序列数据库中检索信息的关键字。但是这个访问号码或许与真实蛋白质的属性是没有任何意义的。 ; 在本论文中，我们已经研究了一个特定形式的知识表达系统，描述逻辑（DLs），并认为（i）描述逻辑是灵活的强大的，能够以一致的和原则的方式捕捉和分类生物概念。（ii）DLs 可以用于构建本体，可以从生物数据中进行推论. ;关于描述逻辑DL和本体;“框架表示”提供了获取概念和它们之间关系的准确定义的框架。这个框架形式已经在模拟EcoCyc的生物数据中利用。并且已经定义了由框架系统提供服务的专门接口的描述。然而这个表示是静态的，并且是要声明所有的包容，“声明”是层次类表示，这是由建模者做的，而不是系统从描述逻辑中推导出的。;描述逻辑DL(Description Logic)是一个关于知识表示语言的例子，它除了提供关于领域陈述性知识的语言之外，还提供了一个允许对这些知识推理的分类器。利用DL获得的信息可以被分类成为丰富层次的概念和它们的关系。DL是合成的和动态的，相当多地依赖于分类、包容（subsumption）、一致性检索和查询服务器的理念。这意味着可能从现有的概念中构建新概念，并且自动准确地放到格子中（lattice）。;DL至今还没有用于生物领域，但是已经用在知识库的从文献中自动检索信息，和已经大量用于非生物领域包括医学应用例如GALEN项目。GALEN项目选择了Dl作为表示语言。其合成的特性和动态的推理服务分类也是适合生物学领域建模的理想工具。 ;GRAIL（描述逻辑指导模型）语言;例如蛋白质是一个个体类（所有蛋白质），并以此模仿一个概念。蛋白质可能有合成物，例如有“基序（Motif）”这个合成物，那么我们可以通过二元角色“hasComponent （有成分）”表示这个蛋白质。于是我们形成了一个新的概念，可以说“hasComponent Motif”（蛋白质有基序成分），或说“ishasComponentOf Protein”（是有“modif”成分的蛋白质）。;一个GRAIL模型是由三部分组成：它们是“声明（assertions）”，“概念-形成”的运算和推理服务，和“批准（sanction）” ;声明一个模型包含有“要素”概念定义的收集物以及相随角色的收集物。“要素”概念定义是简单的、原子概念（例如基序Motif或蛋白质）它们不能被进一步分解。 ;概念-形成的运算和推理服务 GRAIL提供了能够允许构建概念和角色合成物的运算收集物。和允许我们做结论的推理服务收集物。推理的中心是分类理念，由它推导出“合成物” 的准确层次位置。恰好当概念B的所有实例也都是概念A的实例的时候，才可以说概念A包容概念B。也可以基于这种包容或关系类型按照层次进行概念分类。要素概念在概念层次中有它们的指定位置，这些位置是由建模者明白地陈述而声明的。然而“合成概念”是基于这些概念自动分类成的。 ; 例如利用角色“ishasComponentOf”的要素概念是“基序Motif”和“蛋白质Protein”，那么可以合并产生一个复杂的概念“Motif which ishasComponentOf Protein”（是蛋白质成分的基序）。 GRAIL分类器把这个合成物放到层次中“Motif”的下面。如果这个概念被再进一步做概念合成的话， GRAIL分类器或许会自动地再分类它。; GRAIL支持多重继承, 在DL中的有多父辈继承的分类概念的性质，这是完全不同于传统的术语分类学；在传统分类中概念以类似于树的结构组织并且每个概念只有一个父辈。因此DL是比传统的术语分类学更加灵活并且自然地支持对相同概念的多重视角。 ; 利用合并现有的概念创建新概念的能力是“合成力compositionality”。这意味大量的概念可以从相对稀疏的流行概念中产生。利用这样的模型就逃不掉与服务器理念和推理绑定在一起： GRAIL模型不是静态树应该被认为是可以由应用来查询的一个资源。 ;批准为了约束（restrict）复杂概念的构成，GRAIL只是对那些有语义意义的概念提供了“规则”和“批准”，它们指出对那些概