生物信息据库.ppt

  1. 1、本文档共93页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息据库

生物分子数据库几个明显的特征: (1)数据库的更新速度不断加快 数据量呈指数增长趋势 (2)数据库使用频率增长更快 (3)数据库的复杂程度不断增加 (4)数据库网络化 (5)面向应用 (6)先进的软硬件配置 一. 核酸序列数据库 三大核酸序列数据库 GenBank /Genbank/index.html EMBL(European Molecular Biology Laboratory) http://www.ebi.ac.uk/embl/ DDBJ(DNA Data Bank of Japan) http://www.ddbj.nig.ac.jp/index-e.html GenBank 1982.4 由Los Alamos National Lab创建 NCBI (National Center for Biotechnology Information) NIH (National Institute of Health) 数据库查询工具:Entrez 数据提交工具: Sequin Nucleic Acids Research, 2008 Jan;36(Database issue):D25-30 GenBank中测序最多的20个物种 Refseq 1. 提供高质量的,无冗余的,完整的序列信息; 2. 包括基因组的DNA,转录成的RNA以及蛋白质序列信息。 3. 序列文件的标识符: mRNA序列:NM_001158 非编码RNA:NR_002769 蛋白质序列: NP_001159 /RefSeq/ GenBank VS. RefSeq EMBL 1982.3 由德国科隆大学收集整理 EBI(European Bioinformatics Institute) 数据库查询工具:SAS (开源) 数据提交工具:WebIn, Sequin http://www.ebi.ac.uk/embl/ DDBJ 创建于1986年 NIG(National Institute of Genetics) 数据库查询工具:SAS 数据提交工具: Sequin http://www.ddbj.nig.ac.jp/index-e.html INSDC 1998年,GenBank、EMBL和DDBJ共同成立了国际核酸序列数据库协会(International Nucleotide Sequence Database Collaboration,INSDC) 三大核酸数据库之间每天将新测定或更新的数据进行交换共享,保证数据信息的完整与同步,每两个月更新一次版本。 / 三大核酸数据库之间的联系 二. 蛋白质序列数据库 蛋白质序列数据库 PIR / SwissProt http://www.expasy.ch/sprot/ TrEMBL http://www.expasy.ch/sprot/ PIR 1984年,蛋白质信息资源(Protein Information Resource,PIR)计划由美国国家医学研究基金会(NREF)正式启动 1988年,日本的国际蛋白质信息数据库(JIPID)和德国慕尼黑蛋白质序列信息中心(MIPS)加入PIR 非冗余、高质量注释、全面分类 Swiss-Prot 1986年,由瑞士日内瓦大学创建。 SIB(Swiss Institute of Bioinformatics) ExPASy(Expert Protein Analysis System) 所有序列条目均经过有经验的分子生物学家和蛋白质化学家审核,因此又称为蛋白质专家库 TrEMBL 1996年创建,意为“Translation of EMBL” 从EMBL的cDNA序列翻译而来,包含EMBL数据库中所有核酸编码序列信息 ExPASy ExPASy Proteomics Tools UniProt 2002年在NIH资助下将PIR、Swiss-Prot和TrEMBL合并为UniProt(Universal Protein Resource) 具有全世界最全面的蛋白质分类信息 包含三个子库 UniProtKB(UniProt Knowledgebase) UniRef(UniProt Reference Clusters) UniParc(Uniprot Archive) UniProtKB UniProt Knowledgebase(UniProtKB): Release 15.4 , 16-Jun-2009 ,包括: Swiss-Prot Release 57.4 : 497293 entries TrEMBL Release 40.4 : 9145906 entries

文档评论(0)

1444168621 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档