生物信息学(李霞)第1章讲课.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SRS标准检索页面 SRS标准检索页面检索基因名为“KRAS”蛋白序列输入示意图 SRS标准检索结果输出页面 小 结 本章介绍了生物信息学常用的数据库和重要网站,重点介绍了三大核酸数据库:GenBank数据库、EMBL数据库和DDBJ数据库。 NCBI 的Entrez Gene将分类、基因组、图谱、序列、表达、结构、功能、索引文献和同源数据链接在一起,为用户提供了便捷的检索方式。 EBI的SRS检索系统是世界上主要的生物信息学、基因组和相关数据整合、分析和显示工具。SRS检索系统是个开放的系统,可以根据用户不同的需要安装不同的数据库,便于用户开发具有自己特性的操作平台,尤其在数据分析方面,对于检索的信息可以进行多种方式的分析处理。 * DNA和蛋白质相互作用数据库:DPInteract 蛋白质翻译后修饰相关数据库: O-GlycBase、PhosphoBase、RES蛋白质等蛋白质 一、PIR数据库 蛋白质信息库(PIR)(/pirwww/)是一个支持基因组学、蛋白质组学和系统生物学检索和科学研究的综合公共生物信息学资源。 PIR是由美国国家生物医学基金会(NBRF)于1984年建立,帮助研究者确认和解释蛋白序列信息的数据库。 PIR免费为科学界提供包括蛋白序列数据库(PSD)在内的蛋白数据库和分析工具。 PIR信息库资源 PIR主要数据库: 1. UniProt-通用蛋白质资源库 2. iProClass-蛋白质知识整合数据库 3. PIRSF-蛋白质家族分类系统 4. iProLINK-蛋白质文献、信息和知识整合数据库 1.UniProt-通用蛋白质资源库 UniProt(/)是存储和链接其他蛋白质数据库的资源库,并且是蛋白质序列和具有综合功能注释目录的中心资源库。使用UniprotKB可以检索准确、可靠的蛋白综合信息。使用UniRef可以减少冗余,加速序列相似性搜索。使用UniParc可以检索存档序列和它们来源的数据库。 2. iProClass-蛋白质知识整合数据库 iProClass(/iproclass/)提供来自90多个生物学数据库的大量整合数据,包括蛋白ID图谱服务、UniProtKB编注蛋白质摘要描述和筛选UnParc数据库的蛋白质序列。使用iProClass可以检索最新的蛋白质综合信息,包括:功能、转导通路、相互作用、家族分类、基因和基因组、功能注释标准体系(ontology)、文献和分类学信息。使用iProClass还可以检索ID图谱、蛋白质词典和相关序列。 3. PIRSF-蛋白质家族分类系统 PIRSF(/pirsf/)分类系统概要论述家族的特征,如家族名称、分类分布、分级和功能域结构,以及家族成员,包括功能、结构、传导通路、功能注释标准体系(ontology)和家族分类。利用这些信息可以获得蛋白质的准确功能或预测的功能和该蛋白质所属家族成员共有的其他特征。 4. iProLINK-蛋白质文献、信息和知识整合数据库 iProLINK(/iprolink/)提供有关注释内容的文献、蛋白质名称词典和其他有助于文献挖掘的人文语言处理技术开发的信息、数据库校正、蛋白质名称标记和功能注释标准体系(ontology)。使用iProLINK可以获得描述蛋白质记录的文本文献资源,在UniProtKB记录(生物词典)中加入蛋白质或基因命名的图谱,获得用于开发文本挖掘算法的注释数据集、挖掘蛋白质磷酸化(RLIMS-P)文献和获得蛋白质功能注释标准体系(ontology)(PRO)信息。 二、MIPS数据库 慕尼黑蛋白质序列信息中心(MIPS)(http://www.helmholtz-muenchen.de/en/mips),它的重点工作是基因组生物信息学,特别注重基因组信息系统分析,包括应用生物信息学方法注释基因组、表达分析和蛋白质组学方面研究。MIPS支持和维护一系列基因组数据库以及系统,可以提供细菌、真菌和植物基因组比较分析服务。在该站点提供基因组分析工具、数据库检索系统、表达分析、蛋白相互作用等网络服务。 三、其他重要的蛋白质序列数据库: PRINTS Pfam (一)PRINTS PRINTS(http://www.bioinf.manchester.ac.uk/dbbrowser/PRINTS/index.php)是蛋白基序指纹图综合数据库,每个指纹图都是使用数据扫描程序ADSP或VISTAS序列分析软件包反复优化后定义的。数据库中有两种类型指纹图,根据指纹图的复杂性分为简单和复合指纹图:简单指纹图基本上是单一的基序,而复合指纹图包含多个基序。 (二)Pfam 蛋白质一般是由一个或多个功能区域组成,这些功能区域通常称作域(domain)。在不同的蛋白质中不同的

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档