基因功能注释分析.pdfVIP

  • 113
  • 0
  • 约6.06万字
  • 约 64页
  • 2020-08-02 发布于山东
  • 举报
基因功能注释分析 © Wang Zhi-Gang Bioinformatics, Peking Union Medical College, Beijing wangzg.pumc@ 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ZG Wang (PUMC) 基因功能注释分析 2018 1 / 64 1 引言 2 基因功能注释数据库 三个常用的数据库 GO 简介 GO 数据库的使用 KEGG 简介 KEGG 的使用 3 GSEA 基因集富集分析 GSEA 的相关概念 GSEA 快速入门(使用 Gene Ontology ) 理论基础:分类和过表达 使用染色体定位 GSEA 使用 GO 进行 GSEA DAVID 的使用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ZG Wang (PUMC) 基因功能注释分析 2018 2 / 64 表达谱的数据的分析流程 1 数据预处理及标准化 将芯片数据转换成探针(基因)-表达水平的二维表 芯片噪声过滤(如手指印,一些表达为负的探针) 补缺失值 数据标准化(片内标准化和片间标准化) 2 差异表达分析,并对得到的感兴趣基因进行注释(例如功能, Pathway,疾病,文献,染色体定位等),数据绘图 3 基于全局基因或差异表达基因进行聚类分析,主成份分析, 并数据 可视化 4 功能富集分析 (GO, Pathway ),及数据可视化 5 建立分类模型(以差异表达基因的表达值为自变量,以芯片对应的 疾病状态为应变量),Logistic 回归模型,knn 分类模型,Random Forest,支持向量机等等, 应用交叉验证或者新样本对以上模型进行 评估,并应用于临床 6 网络分析,例如分析感兴趣的基因在PPI 网络中的关联(可用于解 释发现的结果),及数据绘图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ZG Wang (PUMC) 基因功能注释分析 2018

文档评论(0)

1亿VIP精品文档

相关文档