网站大量收购独家精品文档,联系QQ:2885784924

医学生物信息基础_第7讲_数据库(简)教材教学课件.ppt

医学生物信息基础_第7讲_数据库(简)教材教学课件.ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
毕业论文毕业设计开题报告论文报告设计报告可行性研究报告

生物医学信息学的重要 数据库 (简);第一节 引言;一、生物信息学数据库产生背景;?;第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少 对于第二部密码,目前则只能用统计学的方法进行分析 无论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量的生物分子数据之中。; 随着生物信息学 (Bioinformatics)发展,通过检索数据库进行核酸序列同源性检索,电子基因定位、电子延伸、电子克隆和电子表达以及蛋白质功能分析、基因鉴定等方面起到了重要作用,已成为人们认识生物个体生长发育、繁殖分化、遗传变异、疾病发生、衰老死亡等生命过程的有力工具。;?;生物分子数据库应满足5个方面的需求 (1)时间性 (2)注释 (3)支撑数据 (4)数据质量 (5)集成性 ;《Nucleic Acids Research》杂志;四、生物信息学主要数据库分类 Bioinformatics database; 相关数据库及其主要分类;基因图谱数据库 核酸序列数据库 蛋白质序列数据库 大分子结构数据库等 国际著名的生物信息中心 NCBI National Center for Biotechnology Information (US)? EBI European Bioinformatics Institute (EU) HGMP Human Genome Mapping Project Resource Centre (UK ) ExPASy Expert of Protein Analysis System (Switzerland ) CMBI Centre of Molecular and Biomolecule (The Netherlands) ANGIS National Genome Information Service (Australia)? NIG National Institute of Genetics (Japan) BIC National Bioinformatics Centre (Singapore) ;生物信息学数据库的分类 (一)按生物分子种类、结构和功能分类 核酸序列数据库 蛋白质序列数据库 蛋白质结构数据库 基因组数据库;生 物 分 子 信 息; 广义上讲,生物信息学数据库主要分为两大类,包括基本数据库和二级数据库。 基本数据库主要包括原始数据,例如DNA序列、蛋白质序列和蛋白质结构等信息。 二级数据库则主要是对基本数据库进行分析、提炼加工后而形成,旨在使得基本数据库使用,例如,真核生物启动子数据(eukaryotic promoter database,EPD)和蛋白质序列库的共同结构和功能基序数据库 (PROSITE database)等。;生物分子数据库 一级数据库 数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释 二级数据库 对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的 。; 二级数据库简介;ColiBri网址:/Colibri;TransFac网址:;Prosite网址:/prosite;C) 蛋白质结构二级数据库;FSSP网址:http://www2.embl-ebi.ac.uk/dall/fssp;建立分子生物信息数据库的流程图; 一个数据库记录(entry)一般由两部分组成: 1. 原始序列数据(sequence data) 2. 描述这些数据生物学信息的注释(annotation) 注释中信息与相应序列数据同样重要和有应用价值; 不同的分析方法产生不同应用范围的二级数据库,这类数据库在实践中往往更受重视。但是,如果要采用新的算法进行数据分析,那就必须从基本数据库出发进行考虑。 二级数据库也被用来进一步分析以形成新的数据库。 一个典型数据库记录通常包括两部分:原始(序列)数据和对这些数据进行的生物学意义的注释。这些注释和原始(序列)数据具有同等重要性。; 人类基因组计划获得了大量的基因组序列数据,然而由于对这些数据进行生物学功能的注释远远落后自动测序仪每天所产生的大量序列数据,所以当进行序列同源性分析得到与这类缺乏注释的数据相关的信息时,其信息的可用性则受到一定的影响。 ; 使用数据库时还必须注意到不同的数据库在原始数据和序列注释方面的侧重点不同,而序列注释方面的更新是个大问题,因为信息更新很快,有的注释信息还存在一些错误。 ; 数据库格式简介;分子生物学三种重要的

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档