- 29
- 0
- 约小于1千字
- 约 8页
- 2018-01-18 发布于未知
- 举报
聚类以及热图
案例1
背景:两组样本(健康人和癌症病人),30个bio-maker基因,其基因表达量理论上可以将两类人群分开。
目的:请用图形展示这些基因对人群的分类效果。
数据:exp_top30.original.txt
一行一个基因,表头为样本,T为tumor,N为normal,GD为广东人,GX为广西人。
先尝试画出如下效果
个人实操
请修改两个脚本,绘制热图、PCA图,查看分类效果;
脚本修改点提示:
输入和输出文件设定;
脚本报错后修改;
注意:热图是否会遇到问题
画图注意点
1)绘制图形,要注意输入的表中,是否有异常字符(例如非数字字符,“NA”,“-”等)
2)务必保证每一行的格子数相同;
3)绘制热图不能有值全部都为“0”的行,应该删去。
4)绘制热图不能有重复行,即Gene ID不能出现重复
小组讨论:进阶修改
1)采用了样本在列方向排列的布局方式;
2)样本地域和性状提前分好类,所以并不聚类;加标签后更加美观;
3)基因实际上已经聚类,这样图片颜色更加整齐划一;但聚类树并没有画出(为了美观);
思路
1)excel 重新排版(转置,并重新整理)
2)重新定义脚本,包括:
a)调整热图格的高宽比;
b)是否聚类,是否展示树)
c)定义标签分类的数据框;
3)输出,后期修图(inkscape 或
您可能关注的文档
- §20李祺熠可回收下腔静脉滤器RIVCF取出的经验分享.pptx
- §20培训课件PAD引导场景以及话术确认版.pptx
- §20培训课件门店货品管理规范确认版.pptx
- §2银企直联孙珂NCV60银企直联培训.pptx
- §1.筹备期计划管控要点培训.pptx
- §1.第一讲HTML的发展史html5的生前身后.pptx
- §1.第一章聆听与感悟.pptx
- 2015.12.11宋媛媛Module10unit1定稿.pptx
- 2015.12.11宋媛媛unit1module102章节.pptx
- 2015.12.11宋媛媛复件unit1module102章节.pptx
- GB/T 20818.11-2026工业过程测量和控制 过程设备目录中的数据结构和元素 第11部分:测量设备电子数据交换用属性列表(LOPs) 通用结构.pdf
- 中国国家标准 GB/T 20818.11-2026工业过程测量和控制 过程设备目录中的数据结构和元素 第11部分:测量设备电子数据交换用属性列表(LOPs) 通用结构.pdf
- 中国国家标准 GB/T 47358-2026环境管理体系 在设计和开发中引入材料循环的指南.pdf
- GB/T 47358-2026环境管理体系 在设计和开发中引入材料循环的指南.pdf
- 《GB/T 47358-2026环境管理体系 在设计和开发中引入材料循环的指南》.pdf
- 市场监管局投诉处理服务投标方案.docx
- 秩序辅助维护管理服务投标技术服务方案.docx
- 数字乡村战略下乡村旅游设计方案.pdf
- 乡村卫生人员培训投标方案.docx
- 铁路沿线乡村绿化提升项目投标方案.docx
原创力文档

文档评论(0)