第四节 基因表达数据的聚类分析 基因表达数据主要来自于两个方面: 一是基因芯片,这是最主要的表达数据来源,利用基因芯片技术可以大规模并行获取基因转录结果mRNA的数据。 表达系列分析SAGE和差异显示、蛋白质芯片等是快速检测蛋白质及其含量的另一类技术。 聚类分析是模式识别中一种非常有吸引力的方法,特别适用于模式分类数不知道的情况。 从机器学习的角度来看,有两种基本的聚类分析: 有教师聚类 无教师聚类 基因表达数据聚类分析一般包括以下几个步骤: (1)确定基因表达的数据 (2)计算相似性矩阵,各个矩阵元素代表两个基因的表达是否相似 (3)选择算法进行聚类分析 (4)显示分析结果。 对数据进行聚类分析之前,必须将包含在基因表达矩阵中的数据进行相似程度分析,并且对分析结果进行量化。 通常情况下,相似往往被赋于一个较大的量化的值,而不相似则由一个较小的量化的值来表示。 在实际计算中,往往以距离代替相似的概念,相似性度量被转化为两个基因表达模式之间的距离。距离越小,表达模式越相近,反之,则表达模式差异大。 几种常用的聚类方法 1.简单聚类 2.层次式聚类 3.K平均聚类 4.自组织映射神经网络 5. 模糊聚类分析方法 6、聚类分析结果的树图表示 第五节 基因调控网络分析 一个基因网络由一组生物分子(如基因、蛋白质)以及它们之间的相互作用构成,这些生物分子共同完成一些特定的细
您可能关注的文档
最近下载
- 解读《危险化学品安全法》.pptx VIP
- (高清版)G-B∕T 14318-2019 辐射防护仪器中子周围剂量当量(率)仪.pdf VIP
- 高频精选:公证处面试题库及答案.doc VIP
- 生活中的立体图形(教学设计)-2024华东师大版七年级数学上册.pdf VIP
- 北师大版(2025) 必修第三册 Unit 7 Art Lesson 3 A Musical Genius课件(共22张PPT)(含音频+视频).pptx VIP
- [T_CAMRA 017—2021]铝合金车轮修复规范.pdf VIP
- 建筑消防设施检测方案.docx VIP
- 浙教版 人教版 培智生活语文三年级下册 教案.docx VIP
- BS EN 12420-1999 Copper and copper alloys - Forgings.pdf VIP
- 期末重难点练习卷-2024-2025学年语文七年级下册统编版(含答案).docx VIP
原创力文档

文档评论(0)