[理学]第二章 生物数据库.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]第二章 生物数据库

第二章 生物信息数据库 本章主要内容 ——核酸序列数据库 ——蛋白序列数据库 ——结构数据库 ——其它生物信息数据库 ——生物数据格式 ——数据库检索 生物数据库发展特征 数据库使用频率增长更快 使用频率年增长接近于500% 数据库的复杂程度不断增加 除基本数据外,包括大量注释、链接、参考文献等信息。 数据库网络化 几乎所有数据库都可通过互联网访问,且相关数据之间相互链接。有的系统将多个生物数据库整合在一起,形成数据库集成系统。 面向应用 各数据库提供许多分析工具,如核酸数据库提供序列搜索、基因识别工具等。 生物信息数据库类型 核酸序列数据库 蛋白质序列数据库 蛋白质结构数据库 基因组数据库 二级数据库(专业数据库) 核酸序列数据库 三大核酸序列数据库 GenBank /Genbank/index.html EMBL(European Molecular Biology Laboratory Nucleotide Sequence Database) http://www.ebi.ac.uk/embl/ DDBJ(DNA Data Bank of Japan) http://www.ddbj.nig.ac.jp/index-e.html EMBL核酸序列数据库:由欧洲生物信息学研究所(EBI)维护的核酸序列数据库,查询检索可以通过SRS系统完成。 DDBJ数据库:是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。 1988年,GenBank\EMBL\DDBJ三个中心达成了国际核苷酸序列数据库合作协议(International Nucleotide Sequence Database Collaboration),对数据库的记录采用共同的格式,并且每个数据库只负责更新提交到这一数据库的那些数据。 蛋白序列数据库 蛋白质序列数据库——UniProt UniProt (Universal Protein Resource) 2002年在NIH资助下由SWISS-PROT 、 TrEMBL 和 PIR数据库合并而成 蛋白质序列数据库——UniProt 蛋白结构数据库 基因组数据库 其他生物信息数据库 TRANSFAC转录因子数据库是关于转录因子以及与DNA结合位点的数据库。 DIP蛋白质相互作用数据库(Database of Interacting Proteins)收集了由实验验证的蛋白质-蛋白质相互作用 Gene Ontology(GO)数据库 基因功能的传统分类 数据库格式 序列数据库格式( FASTA ) gi|995614|dbj|D49653|RATOBESE Rat mRNA for obese. CCAAGAAGAAGAAGACCCCAGCGAGGAAAATGTGCTGGAGACCCCTGTGCCGGTTCCTGTGGCTTTGGTCCTATCTGTCCTATGTTCAAGCTGTGCCTATCCACAAAGTCCAGGATGACACCAAAACCCTCATCAAGACCATTGTCACCAGGATCAATGACATTTCACACACGCAGTCGGTATCCGCCAGGCAGAGGGTCACCGGTTTGGACTTCATTCCCGGGCTTCACCCCATTCTGAGTTTGTCCAAGATGGACCAGACCCTGGCAGTCTATCAACAGATCCTCACCAGCTTGCCTTCCCAAAACGTGCTGCAGATAGCTCATGACCTGGAGAACCTGCGAGACCTCCTCCATCTGCTGGCCTTCTCCAAGAGCTGCTCCCTGCCGCAGACCCGTGGCCTGCAGAAGCCAGAGAGCCTGGATGGCGTCCTGGAAGCCTCGCTCTACTCCACAGAGGTGGTGGCTCTGAGCAGGCTGCAGGGCTCTCTGCAGGACATTCTTCAACAGTTGGACCTTAGCCCTGAATGCTGAGGTTTC 以上这个FASTA文件中包含了GenBank检索号码、Accession number 、LOCUS名称、以及GenBank记录中的DEFINATION字段。 一种最简单的fasta序列形式可以表示为: D49653 CCAAGAAGAAGAAGACCCCAGCGAGGAAAATGTGCTGGAGACCCCTGTGCCGGTTCCTGTGGCTTTGGTCCTATCTGTCCTATGTTCAAGCTGTGCCTATCCACAAAGTCCAGGATGACACCAAAACCCTCATCAAGACCATTGTCACCAGGATCAATGACATTTCACACACGCAGTCGGT

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档