确定基因表达的数据-东南大学生物电子学国家重点实验室.pptVIP

  • 1
  • 0
  • 约2.89千字
  • 约 36页
  • 2019-06-08 发布于天津
  • 举报

确定基因表达的数据-东南大学生物电子学国家重点实验室.ppt

第四节 基因表达数据的聚类分析 基因表达数据主要来自于两个方面: 一是基因芯片,这是最主要的表达数据来源,利用基因芯片技术可以大规模并行获取基因转录结果mRNA的数据。 表达系列分析SAGE和差异显示、蛋白质芯片等是快速检测蛋白质及其含量的另一类技术。 聚类分析是模式识别中一种非常有吸引力的方法,特别适用于模式分类数不知道的情况。 从机器学习的角度来看,有两种基本的聚类分析: 有教师聚类 无教师聚类 基因表达数据聚类分析一般包括以下几个步骤: (1)确定基因表达的数据 (2)计算相似性矩阵,各个矩阵元素代表两个基因的表达是否相似 (3)选择算法进行聚类分析 (4)显示分析结果。 对数据进行聚类分析之前,必须将包含在基因表达矩阵中的数据进行相似程度分析,并且对分析结果进行量化。 通常情况下,相似往往被赋于一个较大的量化的值,而不相似则由一个较小的量化的值来表示。 在实际计算中,往往以距离代替相似的概念,相似性度量被转化为两个基因表达模式之间的距离。距离越小,表达模式越相近,反之,则表达模式差异大。 几种常用的聚类方法 1.简单聚类 2.层次式聚类 3.K平均聚类 4.自组织映射神经网络 5. 模糊聚类分析方法 6、聚类分析结果的树图表示 第五节 基因调控网络分析 一个基因网络由一组生物分子(如基因、蛋白质)以及它们之间的相互作用构成,这些生物分子共同完成一些特定的细

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档