基因表达谱聚类.docxVIP

  • 4
  • 0
  • 约8.82千字
  • 约 10页
  • 2023-05-12 发布于天津
  • 举报
基因表达谱聚类分析 [文章来源:I文章作者:I发布时间:2006-12-211字体:[大中小] 学习过程可以采用从全局到局部的策略。采取这种策略时,学习初期可设定较大的交互作用半径R,随着学习过程的不断推进,逐步减小R,直至不考虑对邻近单元的影响。邻域的形状可以是正方形或者圆形。 KFM的聚类结果与K均值相似,它的优点是自动提取样本数据中的信息,同时也是一种全局的决策方法,能避免陷入局部最小,缺点在于必须实现人为设定类的数目与学习参数,而且学习时间较长。KFM方法克服了K-均值聚类的一些缺点:它应用类间的全局关系,能提供大数据集内相似性关系的综合看法,便于研究数据变量值的分布及发现类结构。而且,它具有更稳健更准确的特点,对噪声稳定,一般不依赖于数据分布的形状。 8.4.2.5其它聚类方法 聚类方法是数据挖掘中的基本方法,数据挖掘的方法很多,在基因表达谱的分析中,除了以上常用方法外,还有一些其它的方法。由于对聚类结果尚没有一种有效的方法进行评价,尤其是对聚类结果的进一步生物学知识发现尚没有新的分析思路和成功应用,因此,科学家们在不断地研究一些新方法。这些方法有不同的原理,能够提取不同数据特征,有可能对具体的数据得到更有意义的结果,发现更多的生物学知识。这里,简单介绍这些方法的原理,更详细的介绍请参看相关文献。 模糊聚类分析方法:这是一种模拟人类的思维方法,通过隶属度函数来反映某一对象属于某一类的程度。基本思路是计算两两基因表达谱之间的相似性程度,构建模糊相似矩阵,利用模糊数学中的传递闭包计算方法得到模糊等价矩阵,选择不同的置信水平从模糊等价矩阵中构建动态聚类图。对于特定的置信水平,可以实现对基因表达谱的分类。该方法的优点是利用了模糊数学中的隶属度概念,能够更好的反映基因表达谱之间的相互关系,而且它是一种全局的优化方法,与向量的顺序无关。 模糊C均值算法:该方法同样将模糊数学中的隶属度概念引入到常用的K均值聚类方法中。对于K均值算法,一个基因表达谱所属的类只有一个,因此,它与各类别的关系要么是1,要么是0,即属于或不属于某一类。而对于模糊C均值法,一个基因表达谱是否属于某一类,是以隶属度来确定第i个样本属于第j类的可能性。 最终的聚类结果取决于分析的目的,可以根据最大隶属度来确定基因表达谱的分类,即一个基因表达谱只属于一类;但往往是确定隶属度的阈值,只要大于该阈值,就可以将基因表达谱划分为该类,这样的划分结果是一个基因表达谱可以属于多个类,这也是可以被生物学家接受的。模糊C均值法与K均值法的实现过程基本相同,所不同的是对于;同样它没有一个明确的类界限,模糊C均值法并不是直接将样本向量归类,而是计算属于各类别的隶属度在计算聚类中心时,需要考虑所有的样本向量,根据隶属度四来计算聚类中心。 ;同样它没有一个明确的类界限, 谱聚类:K均值聚类对于聚类中心相距较远的数据样本具有很好的聚类效果,而对于具有同心圆特征的数据样本很难得到好的分类效果,而谱聚类(Spectralclustering)能够很好的对具有这种特征的样本进行聚类。谱聚类是一种基于矩阵特征向量的方法,也是一种能根据顶点之间的权值对图进行划分的方法。用图表示基因表达谱矩阵,基因表达谱可以看作是一组顶点,连接顶点的边的权值反映了两个表达谱之间的相似性,这样就得到有权无向图G(V,A),聚类过程等价于将G划分为不连接的子集,这可以通过简单地删除连接边来实现。聚类过程包括两个步骤:第1步是将表达谱空间转化为相似度矩阵的特征向量空间;第2步是应用简单的K均值法对特征向量空间的特征向量进行聚类,得到的结果就对应了基因表达谱的聚类结果。该方法可以根据特征值自动确定分类数目。谱聚类在聚类过程中进行了特征空间的转换,可以将大的空间转化为较小的空间,从而可以更快速地处理大规模的数据。 超顺磁性聚类:超顺磁性聚类(superparamagneticclustering)是一种基于模拟非均匀铁磁物质的物理特性的聚类方法,将数据聚类问题视为检验不均匀Potts模型的平衡特性。根据表达谱向量之间的距离矩阵构建图,顶点是数据点,如果两个点之间的距离满足K-mutual-neighbor准则,则称为邻居。数据点的聚类等价于有权图的划分。给每一数据点分配一个Potts自旋子,相邻数据点间引入强度随距离下降的相互作用函数。非均匀Potts模型系统随温度变化表现出三相:在低温下,所有自旋子呈现完全有序的排列,系统为铁磁相;随着温度的升高,小区域自旋子形成磁化“颗粒”,附属于同一“颗粒”者相互间产生强耦合,而无关者间相互作用很弱,不同“颗粒”的排列呈无序状态,为超顺磁相;在高温下,系统不表现任何有序性,为顺磁相。在超顺磁相的转换温度下,磁化率表现出显著的峰值。原则上,超顺磁相可以有一系列的转换点。随着温度的升高,系

文档评论(0)

1亿VIP精品文档

相关文档