基因芯片数据分析.pptVIP

  • 35
  • 0
  • 约1.81千字
  • 约 44页
  • 2021-03-15 发布于广东
  • 举报
基因芯片数据分析;1. 基因芯片简介;生物芯片的基本要点;将样品中的DNA/RNA标上荧光标记,则可以定量检验基因的表达水平;A. 按技术手段、探针类型分类 1. Short oligonucleotide arrays (Affymetrix) 2. cDNA arrays (Brown/Botstein) 3. Long oligo arrays (Agilent) 4. Serial analysis of gene expression (SAGE) B. 按实验要求分类 1. 单通道 (Single Channel): 一次检验一种状态 2. 双通道 (Dual Channel): 差异表达基因的筛选 ;(1). cDNA microarrays: 将500~5,000bp的cDNA固载到介质上 (例如玻璃)。Stanford开发设计,通常为双通道,常用于差异表达基因的筛选。 (2). DNA chips: 将寡核苷酸探针 (20~80-mer) 合成到芯片上。Affymetrix开发设计,通常为单通道,一次检验一种状态 。;载玻片;Treatment / control Normal / tumor tissue Brain / liver …;(2) DNA chips;探针长度:25 bp 每个基因:22-40个探针 Perfect Match (PM) vs. MisMatch (MM) probes;三、基因芯片数据分析;2. 图像处理与数据标准化;;对于每个点,可以计算 Red intensity = Rfg - Rbg fg = foreground, bg = background, and Green intensity = Gfg - Gbg and combine them in the log (base 2) ratio Log2( Red intensity / Green intensity) Green intensity (medium): ~1;1. 图像分析 2. 扫描 3. DNA杂交过程 (温度、时间、混合均匀程度等) 4. 探针的标记 5. RNA的抽提 6. 加样 7. 其他;运用哪些基因进行标准化处理 芯片上大部分基因(假设芯片上大部分基因在不同条件下表达量相同) 不同条件间稳定表达的基因(如持家基因) 控制序列(spiked control ) 合成DNA序列或外源的DNA序列,在不同条件下表达水平相同。;before;三、基因芯片数据分析;3. 基因芯片的数据分析;(1) 差异表达基因的分析;Fold change, 一般2-fold increase or decrease (平行实验的样本较少) p-value (平行实验的样本较多);T-test: 学生分布 Excel函数:TTEST(array1,array2,tails,type) Array1为第一个数据集 Array2为第二个数据集 Tails指示分布曲线的尾数。如果 tails = 1,函数 TTEST 使用单尾分布。如果 tails = 2,函数 TTEST 使用双尾分布 Type为 t 检验的类型 1 成对 2 等方差双样本检验 3 异方差双样本检验 ;一般选择双尾分布 异方差双样本检验 Excel函数:=TTEST(B2:D2,E2:G2,2,3) C:对照组;T:实验组;(2) 基因共表达分析; r ~ [-1, 1] r~ 1,正相关 r~ -1,负相关;(3) 基因表达数据的聚类;用树状结构来表征基因表达之间的相似性/相关性;对数据进行聚类 必须给定结果分成多少类 假设该例中,指定为聚成5类; 软件:Cluster 3.0, Michael Eissen, Stanford 最终结果:所有基因芯片数据被聚成5类;(4) 基因表达数据的分类;(5) Map to GO;(5) Map to GO;;(6) Gene regulatory network; 基因转录调控网络;基因转录调控数据库;2.TRRD数据库 ;3. RegulonDB数据库 ;蛋白质互作网络;代谢网络和信号传导网络;(一) 通路数据库;KEGG 代谢通路;BioCyc数据库 ;信号传导通路

文档评论(0)

1亿VIP精品文档

相关文档