- 113
- 0
- 约6.06万字
- 约 64页
- 2020-08-02 发布于山东
- 举报
基因功能注释分析
© Wang Zhi-Gang
Bioinformatics, Peking Union Medical College, Beijing
wangzg.pumc@
2018
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
ZG Wang (PUMC) 基因功能注释分析 2018 1 / 64
1 引言
2 基因功能注释数据库
三个常用的数据库
GO 简介
GO 数据库的使用
KEGG 简介
KEGG 的使用
3 GSEA 基因集富集分析
GSEA 的相关概念
GSEA 快速入门(使用 Gene Ontology )
理论基础:分类和过表达
使用染色体定位 GSEA
使用 GO 进行 GSEA
DAVID 的使用
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
ZG Wang (PUMC) 基因功能注释分析 2018 2 / 64
表达谱的数据的分析流程
1 数据预处理及标准化
将芯片数据转换成探针(基因)-表达水平的二维表
芯片噪声过滤(如手指印,一些表达为负的探针)
补缺失值
数据标准化(片内标准化和片间标准化)
2 差异表达分析,并对得到的感兴趣基因进行注释(例如功能,
Pathway,疾病,文献,染色体定位等),数据绘图
3 基于全局基因或差异表达基因进行聚类分析,主成份分析, 并数据
可视化
4 功能富集分析 (GO, Pathway ),及数据可视化
5 建立分类模型(以差异表达基因的表达值为自变量,以芯片对应的
疾病状态为应变量),Logistic 回归模型,knn 分类模型,Random
Forest,支持向量机等等, 应用交叉验证或者新样本对以上模型进行
评估,并应用于临床
6 网络分析,例如分析感兴趣的基因在PPI 网络中的关联(可用于解
释发现的结果),及数据绘图 . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
ZG Wang (PUMC) 基因功能注释分析 2018
原创力文档

文档评论(0)