转录组数据分析培训班.pptVIP

  • 6
  • 0
  • 约2.88千字
  • 约 32页
  • 2021-09-27 发布于河北
  • 举报
;R语言简介 来源;R语言简介 R软件下载及安装;R语言简介 控制台界面;R语言基本操作 R数据类型;R语言基本操作 基本运算符;R语言基本操作 向量创建;R语言基本操作 矩阵创建;R语言基本操作 数据框创建;R语言基本操作 列表创建;R语言基本操作 数据类型判断及转换;R语言基本操作 特殊数据类型;R语言基本操作 R帮助函数;R语言基本操作 管理工作空间;R语言基本操作 文本输出;导出对象var到test.txt文件 write.table(var, file = “test.txt”, row.names = FALSE, sep = “\t”, quote = FALSE) 读入txt文件 read.table(file, header = FALSE, sep = “\t”) # 对于Excel文件,可以先转换为csv文件,再读入 read.csv(), write.csv() ;R语言统计分析 基本统计;R语言统计分析 部分统计函数;R语言绘图 基本绘图函数;R语言绘图 基本绘图函数及参数;R语言包的安装及使用 CRAN;R语言包的安装及使用 Bioconductor;R语言基本操作 参考书籍;R语言基本操作 练习;R语言在转录组分析中的应用;R语言与转录组 数据导入和查看;过滤未注释基因(grep()) countMatrix_filter - countMatrix[- grep(MSTRG, rownames(countMatrix)), ] head(countMatrix_filter) C1 C2 C3 T1 T2 T3 LOC102181384 6 1 9 8 4 6 LOC102179991 0 0 0 0 0 0 LOC102179993 289 150 295 0 75 64 LOC102179999 663 349 520 205 203 187 LOC108634036 2 4 0 13 4 2 LOC108634035 138 48 181 136 120 91 ;导入差异表达分析结果diff_exp_results.csv并查看 res - read.csv(diff_exp_results.csv, row.names = X) head(res) baseMean log2FoldChange lfcSE stat pvalue padj LOC102181384 5.708624 0.1981462 0.5449477 0.3636059 7.161523e-01 0.958971010 LOC102179993 136.705319 -0.7142030 0.5283680 -1.3517152 1.764664e-01 0.694642950 LOC102179999 331.191246 -0.9296149 0.3123082 -2.9765944 2.914693e-03 0.096923705 LOC108634036 3.988827 0.6837456 0.5247847 1.3029069 1.926066e-01 0.710774645 LOC108634035 118.783445 0.1286635 0.4753086 0.2706946 7.866259e-01 0.972333567 LOC108634034 59.606283 -1.5067266 0.3591658 -4.1950724 2.727845e-05 0.003280661;以fold change大于2倍,校正后p值小于0.05为筛选条件(subset()) res_significant - subset(res_order, abs(log2FoldChange) = 1 padj = 0.05) nrow(res_significant) [1] 281 nrow(res_order) [1] 19947 统计上调和下调基因数(sum()) sum(res_significant$log2FoldChange 0) [1] 159 sum(res_significant$log2FoldChange 0) [1] 122; 选取显著差异的基因,在countMatrix表中找出这些基因的count值 genes_significant - rownames(res_significant) c

文档评论(0)

1亿VIP精品文档

相关文档