7基因芯片数据分析.pptxVIP

下载本文档

9
0
约2.15千字
约 50页
2021-08-14 发布于河北
举报
版权申诉

7基因芯片数据分析.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第七章基因芯片数据分析;　第一节芯片平台及数据库 (General Microarray Platform and Database );　寡核苷酸芯片类似于cDNA芯片，但是在探针的设计上优于cDNA芯片，它的探针并不是来源于cDNA克隆，而是预先设计并合成的代表每个基因特异片段的约50mer左右长度的序列，然后将其点样到特定的基质上制备成芯片，从而克服了探针序列太长导致的非特异性交叉杂交和由于探针杂交条件变化巨大导致的数据结果的不可靠。 ;五、基因表达仓库 Gene Expression Omnibus，GEO 六、斯坦福微阵列数据库 The Stanford Microarray　 Database，SMD ;第二节基因芯片数据预处理(General Microarray Data Type and Database );(二) Affymetrix公司的原位合成芯片;数据过滤;二、数据补缺;(二)数据补缺方法;2、K近邻法;3、回归法 ;三、数据标准化;(二)运用哪些基因进行标准化处理芯片上大部分基因(假设芯片上大部分基因在不同条件下表达量相同) 不同条件间稳定表达的基因(如持家基因) 控制序列(spiked control ) 合成DNA序列或外源的DNA序列，在不同条件下表达水平相同。;1、片内标化(Within-slide normalization) (1) 全局标化(Global normalization); (2) 荧光强度依赖的标化(Intensity dependent normalization); (3) 点样针依赖的标化(Within-print-tip-group normalization) ;(4) 尺度调整(Scale adjustment) 为什么调整不同栅格(grids)间的数据离散度方法：计算不同栅格的尺度因子 ;2、片间标化(Multiple-slide normalization) 线性标化法(Linear scaling methods) 与芯片内标化的尺度调整(Scale adjustment) 方法类似非线性标化法(non-linear methods) 分位数标化法(Quantile normalization) 两张芯片的表达数据的分位数标化至相同，即分布于对角线上。 ;3、染色互换实验(dye-swap experiment ) 的标化实验组对照组芯片1 cy5(R) cy3(G’) 芯片2 cy3(G) cy5(R’) 前提假设：c︽c’ 方法: ; 1、提取定性信号 (1)对每个探针对计算R R = (PM - MM) / (PM + MM) (2)比较R与定义的阈值Tau(小的正值，默认值为0.015 ). (3) 单侧的Wilcoxon’s Signed Rank test产生p值，根据p值定义定量信号值 Present call Marginal call Absent call ;2、提取定量信号 (1)分析步骤获取探针水平数据背景值效正标准化处理探针特异背景值效正探针集信号的汇总;;; ;;;;;;;;第三节差异表达分析(Analysis of Differentially Expression Gene );二、统计学方法 ;2、方差分析 ;三、SAM (Significance Analysis of Microarrays);(二) 分析步骤计算统计量扰动实验条件，计算扰动后的基因表达的相对差异统计量计算扰动后的平均相对差异统计量 ; 确定差异表达基因阈值：以最小的正值和最大的负值作为统计阈值，运用该阈值，统计在值中超过该阈值的假阳性基因个数，估计假阳性发现率FDR值。通过调整FDR值的大小得到差异表达基因。;四、信息熵;第四节基因芯片数据的聚类分析(Cluster Analysis of Microarray Data) ;（二）层次聚类;在对含非单独对象的类进行合并或分裂时，常用的类间度量方法;(三)k均值聚类;(四)自组织映射聚类;第五节基因芯片数据的分类分析(Classification of Microarray Data );二、k近邻分类法 ;三、决策树;(二)分析步骤：提取分类规则，进行分类预测在构造决策树的过程中最重要的一点是在每一个分裂节点