06第六章 常用生物信息学数据库简介.pptVIP

  • 115
  • 0
  • 约1.24万字
  • 约 54页
  • 2017-05-21 发布于浙江
  • 举报

06第六章 常用生物信息学数据库简介.ppt

06第六章 常用生物信息学数据库简介

目前GDB包含对下述三种对象的描述: 1.人类基因组区域 2.人类基因组图谱 3.人类基因组中的变化 除了蛋白质序列数据之外,PIR还包含以下信息: (1) 蛋白质名称、蛋白质的分类、蛋白质的来源; (2) 关于原始数据的参考文献; (3)蛋白质功能和蛋白质的一般特征,包括基因表 达、 翻译后处理、活化等; (4)序列中相关的位点、功能区域。 PIR提供三种类型的检索服务: 一、基于文本的交互式查询,用户通过关键字进行数据查询。 二、标准的序列相似性搜索,包括BLAST、Fasta等。 三、结合序列相似性、注释信息和蛋白质家族信息的高级 搜索,包括按注释分类的相似性搜索、结构域搜索等。 随着核酸测序技术的迅速发展,人类已经得到一部分生物的全基因组数据,如人、小鼠、大鼠等。这些数据对于我们认识基因组信息的奥秘、了解生物体的生长发育的规律是非常重要的。 GDB 人类基因组数据库 SGD 酵母基因组数据库 MGD 鼠基因组数据库 FlyBase 果蝇基因组数据库 WormBase 线虫基因组数据库 。。。。。。。。 Ensembl 综合基因组数据库 (三)基因组数据库 GDB -人类基因组数据库 —The Genome Database 美国Johns Hopkins大学于1990年建立的,现由加拿大儿童医院生物信息中心负责管理。 包括基因、克隆、PCR标记物、断点、细胞遗传学标记、易碎位点、EST、综合区域、contigs、重复等; 包含细胞遗传学图谱、连接图谱、辐射混合图谱、contig 图谱、集成图谱,所有这些图谱都可以被直观地显示出来; 包括基因突变和基因多态性, 加上等位基因频率数据。 Ensembl数据库 Ensembl 是一个综合基因组数据库,它是由EBI和Sanger研究所共同开发的一个系统。 Ensembl包括所有公开的人类基因组DNA序列,通过注释形成的关于序列的特征。现在包括其他基因组,如大鼠、小鼠、线虫、果蝇等。 Ensembl 数据库还提供疾病、细胞等方面的信息,并且提供数据搜索、数据下载、统计分析等服务 。 Ensembl 数据库结构图 Ensembl提供多种查询方式: 通过关键字查询; 用BLAST进行相似序列的搜索; 另一种更直观的方式是显示各染色体用户可以在染色体水平上选择感兴趣的位点, 逐层放大浏览整个基因组。 (四)蛋白质结构数据库 PDB 目前,国际上著名的生物大分子结构数据库是美国布鲁克海文(Brookhaven)实验室的大分子结构数据库PDB (Protein Data Bank)。 PDB中含有通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构,其中主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。 PDB数据库已含有约81957个结构,其中90%是蛋白质的结构。对于每一个结构,包含名称、参考文献、序列、一级结构、二级结构和原子坐标等信息。 PDB中的每条记录有两种序列信息: 一种是显式序列信息(explicit sequence) 在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关于序列的信息。 一种是隐式序列信息(implicit sequence) PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。 其它的蛋白质结构数据库: 蛋白质结构分类数据库SCOP; 蛋白质二级结构数据库DSSP; ……… 三、生物数据库检索 1、利用SRS(序列检索系统)搜索数据库 2、利用Entrez(信息检索系统)搜索数据库 (一)利用SRS搜索数据库 SRS是Sequence Retrieval System的缩写,由欧洲分子生物学实验室开发,最初是为核酸序列数据库EMBL和蛋白质序列数据

文档评论(0)

1亿VIP精品文档

相关文档