- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物学数据库及其检索
生物信息学 Bioinformatics;第一节
生物学数据库简介;一、什么是数据库?;二、生物学数据库;human;模式生物基因组计划;;;;(一)一级数据库和二级数据库;二级数据库( Secondary database ):在一级数据库的信息基础上进行计算机加工处理并增加了许多的人为注释而构成的(例如:NCBI的RefSeq数据库等)。;ATTGACTA;(二)如何查找与研究相关的生物学资源;第二节
常用数据库;常用数据库;结 构;一、核酸数据库;;Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(National Center of Biotechnology Information,NCBI)建立和维护的。 Genbank网址:/Genbank/
;Genbank数据直接来源
测序工作者提交的序列、测序中心提交的大量EST序列、其它测序数据以及与其它数据机构协作交换的数据。
Genbank内容
所有已知的核酸序列和蛋白质序列,还包括对序列的简要描述、科学命名、物种分类名称、参考文献、序列特征表等辅助信息。
Genbank对数据记录的处理
划分为 细菌类、病毒类、灵长类、啮齿类, EST数据、基因组测序数据、大规模基因组序列数据等16类。;/Genbank/;NCBI全称National Center of Biotechnology Information(美国国家生物技术信息中心)
NCBI是美国国立卫生研究院(NIH)的美国国立医学图书馆(NLM)的一个分支。
1988年成立。
网址:/
;当今世界最大的基于Internet的用于分子生物学研究的生物医学研究中心;2. EMBL核酸序列数据库;1986年创建,由日本国家遗传学研究所(DNA Data Bank of Japan,DDBJ)负责维护和管理。使用SRS工具进行数据检索和序列分析,利用Sequin软件向该数据库提交序列。为方便检索DDBJ主页可进行日文和英文互换。
DDBJ的日文版网址: http://www.ddbj.nig.ac.jp/index-j.html/
DDBJ的英文版网址: http://www.ddbj.nig.ac.jp/index-e.html/;国际上最权威的核酸序列数据库;(二)基因组数据库GDB;(一)蛋白质序列数据库
常用的蛋白质序列数据库有SWISS-PROT、PIR、TrEMBL、UniProt、GenPept等,分述如下。
1.SWISS-PROT
SWISS-PROT数据库提供蛋白质序列查询及相似蛋白质序列搜索等服务。
;Swiss-Prot数据库网站主页;SWISS-PROT数据库内容
核心数据:包括蛋白质序列、引用文献、分类信息等。
注 释:包括结构域、功能位点、跨膜区域、二硫键位置、翻译后修饰、与其它蛋白质的相似性等。
SWISS-PROT将广泛收集的相关数据进行合并,且与蛋白质三维结构数据库(PDB)等其他数据库交互索引。
通过SWISS-PROT数据库可以得到某蛋白质的序列,再通过交互引用从PDB数据库得到其结构。SWISS-PROT数据由数据行排列组成,数据格式与EMBL数据库数据格式基本相同。;2. PIR;;3.TrEMBL
;4. UniProt
;UniProt包含UniProtKB、UniRef 和UniParc 3个部分:
(1)UniProtKB数据库(UniProt Knowledgebase):蛋白质序列、功能、分类、交叉引用等信息存取中心;
(2)UniRef数据库(UniProt Reference Clusters):为提高检索的速度,将紧密相关的蛋白质序列合并到同一条记录中。目前,根据序列相似程度可将UniRef数据库分为UniRef100、UniRef90和UniRef50 3个子库
(3)UniParc(UniProt Archive):储存大量蛋白质研究的历史信息。;UniProt网址:/index.shtml;5. GenPept数据库
;(二)蛋白质序列二次数据库 ;PROSITE数据库主页;PROSITE数据库作用:可确定一段新蛋白质序列中包含的功能位点以及其归属的蛋白质家族。
PROSITE的网址:http://www.expasy.ch/prosite/ 或 /prosite/
PROSITE的中国镜像网址是:/prosite/;2.PRINTS
PRINTS蛋白质指纹图谱数据库将多个保守的序列模式作为识别蛋白质家族的特征,与PROSIT
文档评论(0)