GEO数据库简介重点分析.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据集组和表达谱的关系 在GEO DataSets中每个数据集组个体都各自确定一个实验,而在GEO Profiles中每个数据集组都对应多个表达谱个体。 GEO数据的数据检索——方法 从GEO数据库主页面右侧找到搜索栏,直接输入要查找信息的关键词或者检索词,如“mir29a”或者“GDS2225 AND fto”,就会搜索到相应的DataSets和Profiles。 从主页面右侧直接打开库浏览器,从中按照不同的“系列”、“平台”、“样本”、“物种”、“历史”来进行选择需要的数据类型。 直接从GEO数据库的ftp服务器下载。/geo/ GEO数据的数据检索——方法 直接从NCBI主页用Entrez进行检索。 GEO数据主要存放在GEO DataSets和GEO Profiles 两个数据库内。 GEO数据的数据检索——关键词 GEO可和其他NCBI数据库一样用标准关键词的方法和基于文本布尔检索、基于序列检索、基于特有表达行为挖掘检索或结合这些参数来进行检索查询 例如:在GEO DataSets中可以用检索词“prostate cancer AND human[Organism] ”寻找有关人类前列腺癌微阵列实验数据集。 GEO数据的数据检索——关键词 例如:在GEO Profiles数据库中可以用检索词fto[Gene Symbol] AND (Smok*)搜索所有与吸烟相关并包含肥胖基因的相关实验的基因表达谱。 GEO数据的处理 以数据集组GDS402为例来介绍一下GEO数据库提供的一些数据挖掘分析工具。 数据分析工具1 基因表达谱图 数据分析工具2 数据分析工具3 数据分析工具3 数据分析工具4 GEO BLAST GEO2R工具 GEO2R?is an interactive web tool that allows users to compare two or more groups of Samples in a GEO Series in order to identify genes that are differentially expressed across experimental conditions. Results are presented as a table of genes ordered by significance. Unlike GEOs other?DataSet analysis tools, GEO2R does not rely on curated DataSets and interrogates the original Series Matrix data file directly. This allows a greater proportion of GEO data to be analyzed in a timely manner. GEO2R能利用开源软件R平台和bioconductor进行数据处理。 基因芯片数据分析软件 bioconductor 和R平台 MATLAB Bioinformatics?Toolbox 利用GEO2R比较同一系列中不同样本中的基因表达量差异 GEO2R程序在R平台上运行 利用GEO2R求对比组的各样本中基因表达值在样本中的分布状况。(包括箱线图和可供导出的数值) 通过输入实验平台的某个指针项目ID,可以直接检索到该指针对应的基因在不同样本中的表达谱图。 GEO (Gene Expression Omnibus)数据库简介 报告人:沈健 2014.3.8 近几年来,随着分子生物学技术的发展,微阵列芯片技术已成为生物学研究最重要的实验之一,尤其是基因芯片的广泛应用,产生了海量的数据,为基因研究提供大量高通量数据资料。 基因芯片发展历程 (DNARNA印记杂交) (斑点印迹法) 基因芯片概述 基因芯片(DNA芯片)是通过微阵列技术,根据核酸杂交的原理,将大量探针分子固定于支持物上,然后与标记的样品进行杂交,通过检测杂交信号的强度及分布来进行分析。 基因芯片技术流程 基因芯片技术流程 基因芯片检测结果 什么是GEO数据库 随着微阵列芯片技术尤其是基因芯片的广泛应用,产生了海量的数据,为基因研究提供大量高通量数据资料。迫切需要一个统一管理的公共数据库。 基因表达数据库 (Gene Expression Omnibus, GEO)隶属于美国国立卫生研究院的 NCBI。GEO是当今最大、最全面的公共基因表达数据资源。 网址:/geo/ GEO数据库的构成 1.用户提交的原始数据 2.GEO数据库整理后的数据 平台(Platform) 平台是描述一联串在特定实验中被检测或被定量分析的因素,同一个提交者、许多样本有关,是关于用于以高通

文档评论(0)

w5544434 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档