- 2
- 0
- 约2.8千字
- 约 34页
- 2016-12-25 发布于湖北
- 举报
基因表达数据的聚类分析 基因表达数据主要来自于两个方面: 一是基因芯片,这是最主要的表达数据来源,利用基因芯片技术可以大规模并行获取基因转录结果mRNA的数据。 表达系列分析SAGE和差异显示、蛋白质芯片等是快速检测蛋白质及其含量的另一类技术。 聚类分析是模式识别中一种非常有吸引力的方法,特别适用于模式分类数不知道的情况。 从机器学习的角度来看,有两种基本的聚类分析: 有监督聚类 无监督聚类 基因表达数据聚类分析一般包括以下几个步骤: (1)确定基因表达的数据 (2)计算相似性矩阵,各个矩阵元素代表两个基因的表达是否相似 (3)选择算法进行聚类分析 (4)显示分析结果。 对数据进行聚类分析之前,必须将包含在基因表达矩阵中的数据进行相似程度分析,并且对分析结果进行量化。 通常情况下,相似往往被赋于一个较大的量化的值,而不相似则由一个较小的量化的值来表示。 在实际计算中,往往以距离代替相似的概念,相似性度量被转化为两个基因表达模式之间的距离。距离越小,表达模式越相近,反之,则表达模式差异大。 几种常用的聚类方法 1.简单聚类 2.层次式聚类 3.K平均聚类 4.自组织映射神经网络 5. 模糊聚类分析方法 6、聚类分析结果的树图表示 基因调控网络分析 一个基因网络由一组生物分子(如基因、蛋白质)以及它们之间的相互作用构成,这些生物分子共同完成一些特定的细胞功能任务。 在实际
您可能关注的文档
最近下载
- 卢瑟福EMFM KFD9000电磁流量计.docx VIP
- 2025上半年初级软件水平考试《信息系统运行管理员(基础知识)》真题卷(附详细解析).docx VIP
- 鲁奇 煤制甲醇流程图.pdf VIP
- 在全区“高效办成一件事”工作推进会上的讲话.docx VIP
- 2026事业单位工勤技能-北京-北京政务服务办事员三级(高级工)历年参考题库含答案详解5卷试题.docx VIP
- 2024年云南省考评员培训考试题库及答案.docx VIP
- 脓毒血症护理疑难病例讨论.pptx VIP
- 42、2024年路基工程劳务投标报价.xlsx VIP
- 年产5万吨硫膏制取硫磺可研报告.pptx VIP
- 电路与模拟电子技术期末试卷.doc VIP
原创力文档

文档评论(0)