- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因本体论与GO技术 张波 Bozhang_lzu@126.com 2015年9月 本体论的哲学基础 第一哲学:‘是者之所以为 是 者’,以 及‘是者’由 于 本 性 所 应 有 的 性 质。” “是者”(ου/being)是 从 系 词 ‘是’(εiυαi/to be)的 分 词 作 成 的 哲学概念,在西方哲学中可以用作表示泛指一切的概念、其涵盖范围比中文的“存在”、“万物”都要广。 ontology:即我们译作“本体论”并得到广泛流传的这个词,就是由 ont(ου的变式)加上词尾logy(意为科学、学说)组成的。因此,从亚里士多德起,“第一哲学”也就是本体论。 西方哲学分类 生物学与计算机信息学的矛盾 生物信息的巨大与混乱: 生物学家们浪费了太多的时间和精力在搜寻生物信息上。生物学上定义混乱,不同数据库使用不同的术语。计算机难以搜寻,随时间和人为多重因素而随机改变。 生物信息的归类对研究工作带来的挑战: 找一个用于制抗生素的药物靶点,找到所有的和细菌蛋白质合成相关的基因产物,特别是那些和人体中蛋白质合成组分显著不同的。如果一个数据库描述这些基因产物为“翻译类”,而另一个数据库描述其为“蛋白质合成类”,那么这无疑对于计算机来说是难以区分这两个在字面上相差甚远却在功能上相一致的定义。 一、基因本体论(gene ontology) 1988 年对三个模式生物数据库的整合开始:the FlyBase (果蝇数据库 Drosophila),the Saccharomyces Genome Database (酵母基因组数据库 SGD) 和 the Mouse Genome Informatics (小鼠基因组数据库 MGI)。从那开始,GO 不断发展扩大,现在已包含数十个动物、植物、微生物的数据库(详见 GO Consortium Page )。 /GO.consortiumlist.shtml GO的三级语义词汇标准 GO 开发了具有三级结构的语义词汇标准(Ontologies),根据基因产物的相关生物学途径、细胞学组件以及分子功能而分别给予定义,与具体物种无关。 第一,给予并维持语义(terms); 第二,将位于数据库当中的基因、基因产物与 GO本体论语言当中的语义(terms)进行关联,形成网络; 第三,开发相关工具,使本体论标准语言的产生和维持更为便捷。 本体论(The ontologies)介绍 GO 提供了一系列的语义(terms)用来描述基因、基因产物的特性。这些语义分为三种不同的种类: 细胞学组件(CC),用于描述亚细胞结构、位置和大分子复合物,如核仁、端粒和识别起始的复合物等; 分子功能(MF),用于描述基因、基因产物个体的功能,如与碳水化合物结合或 ATP 水解酶活性等; 生物学途径(BP),指分子功能的有序组合,达成更广的生物功能,如有丝分裂或嘌呤代谢等。 GO 的具体定义 细胞组件 即细胞中的位置,指基因产物位于何种细胞器或基因产物组中(如糙面内质网,核或核糖体,蛋白酶体等)。 GO 的具体定义 分子功能 分子功能描述在分子生物学上的活性,如催化活性或结合活性。GO 分子功能用来定义功能而不是整体分子,而且不特异性地指出这些功能具体的时空信息。分子功能大部分指的是单个基因产物的功能,还有一小部分是此基因产物形成的复合物的功能。定义功能的义项包括催化活性、转运活性、结合活性等,更为狭窄的定义包括腺苷酸环化酶活性或钟形受体结合活性等。 生物学途径 生物学途径是由分子功能有序地组成的,具有多个步骤的一个过程。举例来说,较为宽泛的是细胞生长和维持、信号传导。一些更为具体的例子包括嘧啶代谢或α-配糖基的运输等。一个生物学途径并不是完全和一条生物学通路相等。因此,GO 并不涉及到通路中复杂的机制和所依赖的因素。 语义之间的关系及其组织结构 语义之间关系的基本理解 基因本体论组织类似于图,语义作为图的结点,语义之间的关系为图中的边。因此,一旦产生新的语义,其与其它语义之间的关系也会同时被定义。语义之间的关系有三种:is a、part of 和 regulates。 关系表示的几点约定 1. “语义”用图论的术语“结点”表示 2. 我们习惯于用父子结点来表示语义之间的关系,其中父结点离根结点较近,表示相对宽泛的语义,而子结点离叶子结点较近,相对父结点其语义所代表的内容更为具体。 3. 图中的实线表示结点之间的关系 4. 虚线表示推理而并未证明的关系 基本关系图示 语义关系的推导1 is a 的传递性 语义关系的推导2 part of 也具有传递性 语义关系的推导3 part of 具有优先性 调节控制关系(regulate)与推导1 调节控制关系(regulate)与推导1 调
文档评论(0)