第二章 数据库检索.pptVIP

  • 10
  • 0
  • 约4.53万字
  • 约 98页
  • 2017-11-28 发布于湖北
  • 举报
第二章 数据库检索

第二章 数据库检索 生物数据库的类型 几个代表性的数据库 几个数据库检索工具 生物数据库几个明显的特征: (1)数据库的更新速度不断加快 数据量呈指数增长趋势 (2)数据库使用频率增长更快 (3)数据库的复杂程度不断增加 (4)数据库网络化 (5)面向应用 (6)先进的软硬件配置 主要的数据库资源 数据库是生物信息学的主要内容,各种数据库几乎覆盖了生命科学的各个领域。 核酸序列数据库主要有GenBank, EMBL, DDBJ等. 蛋白质序列数据库有SWISS-PROT, PIR, OWL, NRL3D, TrEMBL等, 基因组数据库还有GDB, FlyBase,RGD,MGI等, 三维结构数据库有PDB, NDB, BioMagResBank, CCSD等, 蛋白质结构有关的数据库还有SCOP, CATH, FSSP, 3D-ALI, DSSP等 蛋白质片段数据库有PROSITE, BLOCKS, PRINTS等, 文献数据库有PUBMED,OMIM等。 蛋白质序列数据库 GenBank(美国) SWISS-PROT(欧洲) PIR(美国) SWISS-PROT 1.瑞士日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护 (1986) 2.在EMBL和GenBank数据库上均建立了镜象站点 3.是目前国际上比较权威的蛋白质序列数据库,其中的蛋白质序列是经过检验和注释的 4.数据记录包括两部分:序列和注释信息 TrEMBL 是与SWISS-PROT相关的一个数据库. 包含从EMBL核酸数据库中根据编码序列(CDS)翻译而得到的蛋白质序列,并且这些序列尚未集成到SWISS-PROT数据库中. TrEMBL包含两个部分: (1) SP-TrEMBL(SWISS-PROT TrEMBL) 包含最终将要集成到SWISS-PROT的数据,所有的SP-TrEMBL序列都已被赋予SWISS-PROT的登录号. (2) REM-TrEMBL(REMaiming TrEMBL) 包括所有不准备SWISS-PROT的数据,因此这部分数据都没有登录号. PDB中含有通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构 蛋白质 核酸 糖类 其它复合物 拒绝接收依靠计算机三维建模获得的结构数据。其ID号包含4个字符,可由大写字母和数字组合而成。如 1DFT MMDB(Molecular Modeling Database) 分子模型MMDB 是(NCBI)所开发的生物信息数据库集成系统Entrez的一个部分,数据库的内容包括来自于实验的生物大分子结构数据。 与PDB相比,对于数据库中的每一个生物大分子结构,MMDB具有许多附加的信息,如分子的生物学功能、产生功能的机制、分子的进化历史等 。 还提供生物大分子三维结构模型显示、结构分析和结构比较工具。 PubMed PubMed(/)是NCBI维护的生物学、医学文献引用数据库,提供对MEDLINE、Pre-MEDLINE等文献数据库的引用查询和对大量网络科学类电子期刊的链接。利用Entrez系统可以对PubMed进行方便的查询检索。 北京大学生物信息中心 /chinese/ 二、三大门户网站 NCBI EBI SIB 共同特点: 拥有庞大的一级数椐库、大量工具软件和广泛的外联 NCBI 美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI) NCBI成立于1988年,其主要工作是开发以GenBank为代表的数据库,进行计算生物学研究,开发用于分析基因组数据的软件工具,发布生物医学信息。 Entrez是NCBI著名的用于提取序列信息的工具,它将科学文献、DNA和蛋白质序列数据库、蛋白质三维结构数据、种群研究数据以及全基因组组装数据整合成一个高度集成的系统。类似于EBI的SRS(见下文),是一个查询、提取和显示系统。 The original version(1991) of Entrez had just 3 nods, now grown to nearly 20 nods 在线获取序列( entrez) Entrez是基于Web界面的综合生物信息数据库检索系统。利用Entrez系统,用户不仅可以方便地检索Genbank的核酸数据,还可以检索来自Genbank和其它数据库的蛋白质序列数据、基因组图谱数据、来自分子模型数据库(MMDB)的蛋白质三维结构数据、种群序列数据集、以及

文档评论(0)

1亿VIP精品文档

相关文档