基因表达数据的分类MaptoGOGeneregulatorynetwork.PPTVIP

  • 43
  • 0
  • 约5.91千字
  • 约 55页
  • 2018-05-05 发布于天津
  • 举报

基因表达数据的分类MaptoGOGeneregulatorynetwork.PPT

基因表达数据的分类MaptoGOGeneregulatorynetwork

生物信息学 第八章 基因芯片分析 本章内容提要 1. Microarray简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析 4. Microarray:工具数据库 基因芯片 1. 基因芯片 (1987) 2. 根据免疫测定的 (immunoassay)的方法予以改进 3. 高通量、点阵以及Northern杂交 同时测定细胞内数千个基因的表达情况 将mRNA反转录成cDNA与芯片上的探针杂交 4. 芯片的体积非常小:微量样品的检测 5. 基因表达情况的定量分析 6. 其他类型的芯片: 组织芯片 蛋白质芯片 基因芯片的密度:100-1 million DNA 探针/1cm2 基因表达情况的定量测定 1. 发现在特定生长时期,或者随着环境变化,那些基因的表达收到诱导或者抑制 2. 在相同条件下,上调或者下调变化规律相似的基因,可能具有功能上的关联 3. 可以从共表达的基因中寻找调控模体 4. 基因表达的模式可以用来表征异常的细胞调控,例如,癌症的诊断 基因芯片技术的类型 按技术手段、探针类型分类 1. Short oligonucleotide arrays (Affymetrix) 2. cDNA arrays (Brown/Botstein) 3. Long oligo arrays (Agilent) 4. Serial analysis of gene expression (SAGE) 按实验要求分类 1. 单通道 (Single Channel): 一次检验一种状态 2. 双通道 (Dual Channel): 差异表达基因的筛选 两类主流的DNA芯片 1. cDNA microarrays: 将500~5,000bp的cDNA固载到介质上 (例如玻璃),Stanford开发设计,通常为双通道 2. DNA chips: 将寡核苷酸探针 (20~80-mer) 合成到芯片上,Affymetrix开发设计,通常为单通道 (1) cDNA microarrays 差异表达基因的筛选 基因表达的数据 DNA chips的制备: Affymetrix photolitography 探针长度:25 bp 每个基因:22-40个探针 Perfect Match (PM) vs. MisMatch (MM) probes 点样后的Gene chip 总结 基因芯片的实验流程 2. 图像处理与数据标准化 图像处理 基因表达量的定量 对于每个点,我们可以计算 Red intensity = Rfg - Rbg fg = foreground, bg = background, and Green intensity = Gfg - Gbg and combine them in the log (base 2) ratio Log2( Red intensity / Green intensity) Green intensity (medium): ~1 Microarray: 误差的来源 系统的 随机的 Microarray: 误差的来源 1. 图像分析 2. 扫描 3. DNA杂交过程 (温度、时间、混合均匀程度等) 4. 探针的标记 5. RNA的抽提 6. 加样 7. 其他 数据标准化 3. 基因芯片的数据分析 (1) 差异表达基因的分析 (2) 基因共表达分析 (3) 基因表达数据的聚类 (4) 基因表达数据的分类 (5) Map to GO (6) Gene regulatory network (1) 差异表达基因的分析 1.差异表达基因的分析: 寻找处理前后表达上调或者下调的基因 2. Are the treatments different? 3. 使用标准的统计学方法检验 (t-test or f-test),发现统计显著性差异表达的基因, 4. 如果处理本身并不显著,则结果无意义 统计学分析 1. Fold change, 一般2-fold increase or decrease (平行实验的样本较少) 2. p-value (平行实验的样本较多) P-value: 学生分布 1. T-test: 学生分布 2. Excel函数:TTEST(array1,array2,tails,type) Array1为第一个数据集 Array2为第二个数据集 Tails指示分布曲线的尾数。如果 tails = 1,函数 TTEST 使用单尾分布。如果 tails = 2,函数 TTEST 使用双尾分布 Type为 t 检验的类型 1 成对 2 等方差双样本检验 3 异方差双样本检验 P-value: 学生分布 1. 一般选择双尾分布 2. 异方差双样本检验 3

文档评论(0)

1亿VIP精品文档

相关文档