公用数据库基因组表达谱数据挖掘策略及分析方法.pptVIP

公用数据库基因组表达谱数据挖掘策略及分析方法.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三十一页,共七十五页。 第三十二页,共七十五页。 第三十三页,共七十五页。 Limma法分析的TOP250结果 第三十四页,共七十五页。 第三十五页,共七十五页。 第三十六页,共七十五页。 第三十七页,共七十五页。 第三十八页,共七十五页。 韦恩图 第三十九页,共七十五页。 第四十页,共七十五页。 通路分析 第四十一页,共七十五页。 第四十二页,共七十五页。 第四十三页,共七十五页。 第四十四页,共七十五页。 第四十五页,共七十五页。 生存分析验证 Survexpress http://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jsp KM Plotter /analysis/ 第四十六页,共七十五页。 输入基因名 第四十七页,共七十五页。 第四十八页,共七十五页。 选择分析表型 第四十九页,共七十五页。 第五十页,共七十五页。 第五十一页,共七十五页。 第五十二页,共七十五页。 第五十三页,共七十五页。 第五十四页,共七十五页。 GEO数据本机处理 统计分析+作图软件 SPSS Graphad R 第五十五页,共七十五页。 Kaplan-Meier法 单因素生存分析 分类变量 做生存曲线图 Cox回归模型 单因素或多因素生存分析 分类或连续变量 计算HR和95%CI 生存分析 第五十六页,共七十五页。 第五十七页,共七十五页。 第五十八页,共七十五页。 P值 HR 第五十九页,共七十五页。 第六十页,共七十五页。 李曦 副教授 中南大学湘雅医院临床药理研究所 公用数据库基因组表达谱数据挖掘策略及分析方法 第一页,共七十五页。 Nature Reviews Genetics?16,?85–97?(2015) 第二页,共七十五页。 什么是数据挖掘 从海量数据中揭示潜在的生物学规律。 第三页,共七十五页。 为什么要学习数据挖掘 把握自己的命运 最大化利用已有数据 寻找新的课题 第四页,共七十五页。 数据挖掘的步骤 第五页,共七十五页。 生物医学研究人员的优势 数据处理步骤、统计分析均有工具可以完成 数据挖掘表型的确定 数据的选择 数据挖掘结果的解读 第六页,共七十五页。 生物医学数据挖掘所需技能 必备技能: 基本的生物信息学知识 各种数据库的使用、数据库信息的解读 基本的生物统计学知识 分析方法的选择,分析软件的使用 可选技能: R语言的基本操作 R包的使用 Linux系统的基本操作 生物信息学分析软件的使用 第七页,共七十五页。 基因组表达谱数据挖掘流程 确定研究策略 获取表达谱数据 处理表达谱数据 统计分析 验证分析 第八页,共七十五页。 数据挖掘案例 第九页,共七十五页。 分析策略 核心思路: 影响脑胶质瘤发生发展的基因可能影响脑胶质瘤的预后 分析流程: 获取包含脑胶质瘤组织和正常脑组织的全基因组表达数据的多个数据集 鉴定在脑胶质瘤组织和正常脑组织中差异表达的基因 在自己收集的样本中验证这些基因 分析这些基因与肿瘤分级以及总生存期之间的关系 第十页,共七十五页。 第十一页,共七十五页。 第十二页,共七十五页。 第十三页,共七十五页。 第十四页,共七十五页。 第十五页,共七十五页。 策略举例 影响阿糖胞苷药物敏感性的基因可能影响AML预后。 影响铂类药物敏感性的基因可能影响多种肿瘤的预后。 在高低肿瘤分级中存在差异的基因可能影响癌症预后。 …… 第十六页,共七十五页。 研究策略如何确定 研究策略可以千变万化 研究策略决定了论文的上限 应根据自身专业选择有意义的研究策略 第十七页,共七十五页。 包含基因组表达谱数据的数据库 第十八页,共七十五页。 GEO数据库关键名词 Profile:数据库整理好的单个基因的概述 Datasets:见GDS和GSE。 GSM:单个样本的实验数据 GDS:数据库整理好的关于某个话题的GSM集合。一个GDS中的所有GSM为同一平台。 GSE:一个实验项目中的多个GSM合集,可能使用多个平台。 GPL:芯片平台,如Affymetrix, Agilent等。 第十九页,共七十五页。 第二十页,共七十五页。 Profile示例 实验描述 实验结果展示 第二十一页,共七十五页。 Value:归一化的相对表达量 Rank:探针表达值在所有表达值中的排名的百分比。Rank越高,表达越高。 第二十二页,共七十五页。 Datasets示例 第二十三页,共七十五页。 第二十四页,共七十五页。 第二十五页,共七十五页。 芯片介绍 第二十六页,共七十五页。 芯片注释文件 第二十七页,共七十五页。 样本描述 第二十八页,共七十五页。 第二十九页,共七十五页。 第三十页,共七十五页。 * * * * *

文档评论(0)

虾虾教育 + 关注
官方认证
文档贡献者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档