[医学]生物信息学数据库检索.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[医学]生物信息学数据库检索

生物信息学数据库 信息检索教研室 薛晓芳 2010年11月2日 生物信息学概念 生物信息学是对生物学数据进行收集、处理、存储、检索和分析的一门交叉学科 研究生物信息的采集、处理、存储、传布、分析和解释等各个方面,通过综合数学、计算机科学和生物学的工具与技术来揭示大量而复杂的生物数据所赋有的生物学奥秘 研究目标是发展和利用先进计算技术解决生物学难题 生物信息学数据库 大量生物学数据的存储和利用离不开数据库 用于结构化存储生物数据,以便进一步对数据进行分析和利用 数据库的数据来源 两大主要来源 经典的生物医学研究:大量生物医学科研工作者根据自己的兴趣开展的个别研究 大规模组学研究:代表性工作是大规模人类基因组学和蛋白质组学研究 经典生物医学研究 针对某较小领域开展深入研究,采集的生物学数据 对大量零碎的生物学数据,进一步收集、整理和利用,对推动生物医学的研究有重要意义 最具代表性的是KEGG数据库,该数据库整理收录了大量代谢网络(PATHWAY)的研究成果,描绘了生物体内代谢网络涉及的各种分子及关系 大规模组学研究 上世纪90年代初启动人类基因组计划,短时间内产生海量生物学数据 随着基因组计划进行,多种相关高通量研究逐渐开展起来 基于表达序列标签(EST)和DNA微阵列的高通量转录组研究 基于生物质谱的蛋白质组表达谱和修饰谱研究 基于酵母双杂交等技术的高通量蛋白质-蛋白质相互作用组研究 代谢组等相关的组学研究 组学数据库分类 一级数据库:通过收集组学数据构建的数据库 二级和三级数据库:对一级数据库数据进一步分析、归纳和整理,目的性和实用性 TRANSFAC:转录因子和结合位点数据库 SMART、pFam数据库:收录了可能的蛋白质结构域信息,并提供了特定算法工具 生物信息学数据库的地位和作用 生物信息学数据库类型 核酸研究(Nucleic Acids Research)杂志 每年第一期为生物信息学数据库专刊,收录最主要的生物学相关数据库 2010年的核酸研究杂志提供的数据库列表将国际上生物学数据库归纳为14类(/nar/database/c/) 《核酸研究》的14类数据库 Nucleotide Sequence Databases 核酸序列数据库 RNA sequence databases RNA序列数据库 Protein sequence databases 蛋白质序列数据库 Structure Databases 结构数据库 Genomics Databases (non-vertebrate) 基因组数据库(非脊椎动物) Metabolic and Signaling Pathways 代谢和信号通路 Human and other Vertebrate Genomes 人和其他脊椎基因组 Human Genes and Diseases 人基因和疾病 Microarray Data and other Gene Expression Databases Proteomics Resources微阵列和其他基因表达数据库蛋白质组资源 Other Molecular Biology Databases 其他分子生物学数据库 Organelle databases 细胞器数据库 Plant databases 植物数据库 Immunological databases 免疫学数据库 常用分类类型 序列数据库 结构数据库 功能数据库 其它专业数据库 主要内容 生物信息学数据库类型 序列数据库 结构数据库 功能数据库 其它专业数据库 生物信息学数据库的检索 检索方法概述 检索实践和案例 一、序列数据库 主要收录核酸和蛋白质序列数据 包括由基因组计划产生的基因组及其表达序列,由基因组序列所推测的编码和非编码核酸和蛋白质序列,以及个别生物学实验中测序获得的核酸和蛋白质序列 一、序列数据库(基因组) Genome Database(GDB)数据库 Ensembl,由EMBL - EBI和Sanger研究所联合开发,对后生动物基因组的自动注释和维护/ 包括人、鼠、斑马鱼和果蝇4种真核生物基因组的注释分析,主要依据已测序获得的基因组序列,定位所有已知基因,并预测未知新基因,同时为这些基因提供功能、疾病相关特征等方面的注释信息;Ensembl基因组注释的核心是基

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档