[理学]functionprediction蛋白质功能预测的计算机方法:概述。生物信息学_生物物理_计算生物学.doc

[理学]functionprediction蛋白质功能预测的计算机方法:概述。生物信息学_生物物理_计算生物学.doc

  1. 1、本文档共98页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]functionprediction蛋白质功能预测的计算机方法:概述。生物信息学_生物物理_计算生物学

Computational Approaches for Protein Function Prediction: A Survey Gaurav Pandey, Vipin Kumar and Michael Steinbach Department of Computer Science and Engineering, University of Minnesota 蛋白质功能预测的计算机方法:概述 camelbbs@ 译 蛋白质是生命中最必需和最通用的大分子,对它们的功能的认识与新药的发展、农作物的收成以及生化合成如生物燃料的发展有着重要的联系。实验手段来预测蛋白质功能本身就是低通量的,已经不能用来注释在高速发展的基因组测序技术中所获得的大量蛋白质。这促使人们通过计算机技术,利用各种高通量的实验数据来进行蛋白质预测,如蛋白质和基因组序列、基因表达数据、蛋白质相互作用网络以及系统发生谱等等。事实上,在过去的短短的十年里,关于这个课题已经发表了几百篇文章。本概述的目的在于,根据这些预测方法所用到的数据类型将它们分类并加以讨论,以便对这一重要领域的发展趋势作出预测。希望本文能帮助计算生物学家和生物信息学工作者获得一个关于蛋白质功能的计算机预测这一领域的总览,并找出那些值得进一步研究的地方。 关键词和短语:蛋白质功能预测 生物信息学 基因分类 多重生物数据类型 高通量实验数据 数据挖掘 基于非同源性方法 1 前言 5 2 什么是蛋白功能 7 2.1功能分类计划(Schemes) 8 2.2 GO是途径 10 2.3讨论 12 3蛋白质序列 13 3.1介绍 13 3.2基于同源性的注释转换:用于功能预测的优点 15 3.3简单同源注释转换之外的方法 15 3.3.1基于同源性的方法(homology-based) 17 3.2.2基于亚序列的方法(subsequence-based) 18 3.3.3基于特征的方法(feature-based) 22 3.4讨论 24 4。 蛋白质结构 25 4。1 简介 25 4.2 结构与功能有联系吗? 28 4。3 已存在的方法 29 4.3.1 基于结构相似性的方法(structural similarity-based) 30 4.3.2基于三维基序的方法(three-dimensional motif-based) 31 4.3.3基于表面的方法(surface-based) 33 4.3.4 基于学习的方法(learning-based) 34 4.4讨论 35 5 基因组序列 35 5.1 简介 35 5.2 现有方法 35 5.2.1基于基因组范围的同源性的注释转换(genome-wide homology-based) 36 5.2.2利用基因邻居的方法(neighborhood) 37 5.2.3 利用基因融合的方法(fusion) 38 5.3 方法的比较和互补(comparison and assimilation) 40 6 系统发生数据(phylogenetic data) 42 6.1 简介 42 6.2已有方法 43 6.2.1 使用系统发生谱的方法(phylogenetic profiles) 44 6.2.2 系统发生树方法(phylogenetic trees) 46 6.2.3 杂合方法(hybrid) 48 6.3讨论 49 7 基因表达数据 49 7.1 简介 49 7.2 已有方法 51 7.2.1 基于聚类的方法(clustering-based) 52 7.2.2基于分类的方法(classification-based) 56 7.2.3基于动态性的分析方法(temporal analysis-based) 57 7.3讨论 59 8 蛋白相互作用网络 61 8.1 简介 61 8.2 蛋白相互作用网络的功用 62 8.3已有方法 63 8.3.1基于邻接的方法(neighborhood-based) 64 8.3.2基于全局最优化的方法(global optimization) 66 8.3.3基于聚类的方法(clustering-based) 69 8.3.4基于相关分析的方法(association analysis-based) 70 8.4讨论 71 9文献和文本 72 9.1简介 72 9.2已有方法 72 9.2.1 基于IR的方法 74 9.2.2基于文本挖掘的方法 74 9.2.3基于NLP的方法 76 9.2.4关键字搜索 77 9.3.3标准化举措(standardization initiatives) 78 9.3.1 BioCreAtIvE 79 9.3.2 TREC 2003 Genomics Track 81

文档评论(0)

ipbohn97 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档