生物信息数据库 .pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

生物信息数据库

1生物信息数据库产生背景

上个世纪60年代以来,随着核酸序列测定、蛋白质序列测定以及基因克隆和PCR技

术的不断发展与完善,全世界各研究机构获得了大量的生物信息原始数据。面对这些以指数

方式增长的数据资源,传统的研究方式已经来不及迅速消化,因此有必要采用有效的方法将

它们进行适当的储存、管理和维护,以便进一步分析、处理和利用,这就需要建立数据库即生

物信息数据库[1]。生物信息数据库是一切生物信息学工作的基础。

2生物信息数据库的特点

2.1数据库种类的多样性。生物信息学各类数据库几乎覆盖了生命科学的各个领域,如

核酸序列数据库,蛋白质序列数据库,蛋白质、核酸、多糖的三维结构数据库,基因组数据库,

文献数据库和其他各类达数百种。

2.2数据库的更新和增长快。数据库的更新周期越来越短,有些数据库每天更新。数据

的规模以指数形式增长。

2.3数据库的复杂性增加、层次加深。许多数据库具有相关的内容和信息,数据库之间

相互引用,如PDB就与文献库、酶学数据库、蛋白质二级数据库、蛋白质结构分类数据库、

蛋白折叠库等十几种数据库交叉索引。

2.4数据库使用高度计算机化和网络化。越来越多的生物信息学数据库与因特网联结,

从而为分子生物学家利用这些信息资源提供了前所未有的机遇[2]。

2.5面向应用。首先各个数据库除了提供数据之外,还提供许多分析工具,如核酸数

据库提供的序列搜索、基因识别程序等。此外,还在原始数据库的基础上开发了许多面向

特殊应用的二级数据库,如蛋白质二级结构数据库等[3]。

3生物信息数据库的分类

生物信息数据库种类繁多,归纳起来,大体可以分为5个大类:核酸序列数据库、基因组

数据库、蛋白质序列数据库、生物大分子(主要是蛋白质)结构数据库以及以这4类数据库

和文献资料为基础构建的二次数据库。其中主要类型是序列数据库[4]。来自基因组作图的

基因组数据库、来自序列测定的序列数据库以及来自X-衍射和核磁共振结构测定的结构数

据库是分子生物信息学的基本数据资源,通常称为基本数据库或初始数据库,也称一次数据

库。根据生命科学不同研究领域的实际需要,在一次数据库、实验数据和理论分析的基础上

进行整理、归纳和注释,构建具有特殊生物学意义和专门用途的数据库即二次数据库,也称

专门数据库、专业数据库或专用数据库[2,3,5]。

3.1核酸序列数据库

EMBL、GenBank和DDBJ是国际上三大主要核酸序列数据库。EMBL是德国海德堡

市的欧洲分子生物学实验室(EuropeanMolecularBiologyLaboratory)1980年创建的,

其名称也由此而来。美国国家健康研究院(NationalInstiturteofHealth,简称NIH)也于

1982年委托洛斯阿拉莫斯(LosAlamos)国家实验室建立GenBank,后移交给美国国立卫

生研究院国家生物技术中心(NationalCenterforBio-technology

Information—NCBI)。DDBJ是日本静冈市的日本国立遗传学研究所于1986年创建的日

本DNA数据库(DNADatabaseofJapan—DDBJ)。1988年,EMBL、GenBank与DDBJ

共同成立了国际核酸序列联合数据库中心,建立了合作关系。根据协议,这三个数据库分别收

集所在区域的有关实验室和测序机构所发布的核酸序列信息,并共享收集到的数据,每天交

换各自数据库新建立的序列记录,以保证这三个数据库序列信息的完整性[2]。

3.2基因组数据库

基因组数据库的主体是模式生物基因组数据库,其中最主要的是由世界各国的人类基

因组研究中心、测序中心构建的各种人类基因组数据库。小鼠、河豚鱼、拟南芥、水稻、

线虫、果蝇、酵母、大肠杆菌等各种模式生物基因组数据库或基因组信息资源都可以在网

上找到[2]。

3.3蛋白质序列数据库

PIR和SWISS-PROT是创建最早、使用最为广泛的两个蛋白质数据库。1984年,“蛋

白质信息资源”(ProteinInformationResource,简称PIR)计划正式启动,蛋白质序列数据

库PIR也因此而诞生。SWISS-PROT由瑞士日内瓦

文档评论(0)

. + 关注
官方认证
内容提供者

专注于职业教育考试,学历提升。

版权声明书
用户编号:8032132030000054
认证主体社旗县清显文具店
IP属地河南
统一社会信用代码/组织机构代码
92411327MA45REK87Q

1亿VIP精品文档

相关文档