人类长非编码人类长非编码RNARNA芯片设计和芯片设计和
数据分析数据分析
陈小伟陈小伟
非编码核酸实验室
中国科学院生物物理研究所中国科学院生物物理研究所
2013.11.20
目目 录录
• 芯片设计
–– LncRNALncRNA的系统发现的系统发现
– LncRNA常用数据集
– LncRNALncRNA序列的收集整理序列的收集整理
– LncRNA的分类
– LncRNA探针设计探针设计
• 数据分析
– 数据分析流程
– 芯片内标准化芯片内标准化
– 芯片间标准化
–– 差异表达基因分析差异表达基因分析
– 多重假设检验假阳性率校正
芯片设计
LncRNALncRNA的系统发现的系统发现
高通量技术
• Microarray
– TilingTiling ArrayArray
• High‐throughput Sequencing
– ChIP‐Seq
– RNA‐Seq
Rinn and Chang, 2012
芯片设计
LncRNALncRNA常用数据集常用数据集
LLncRNARNA数据集数据集 llncRNARNA数量数量
NONCODE 33,829
GENCODE 23,105
HumanHuman lincRNAlincRNA CatalogCatalog 14,35314,353
lncRNAdb 118
RRefSfSeq 44,814814
UCSC Genes 5,596
H‐InvDB 1,038
lncRNAslncRNAs fromfrom HOXHOX lociloci 962962
lncRNAs from ultraconserved regions 407
芯片设计
LncRNALncRNA芯片数据来源芯片数据来源
Sources CBC lncRNA V1 CBC lncRNA V2 CBC lncRNA V3
GENCODE/ENSEMBL ‐ 12754 22444
Human LincRNA Catalog ‐ 8195 14353
RefSeq 4765
原创力文档

文档评论(0)