《基因数据聚类分析案例》4300字.docxVIP

  • 0
  • 0
  • 约6.17千字
  • 约 10页
  • 2026-07-05 发布于湖北
  • 举报

PAGE2

基因数据聚类分析案例

目录

TOC\o1-3\h\u31475基因数据聚类分析案例 1

188111.1SparkMLlib 1

240331.2K均值聚类算法 2

250581.3二分K均值聚类 6

37631.4聚类结果分析 9

聚类集成技术是数据挖掘和基因分析中常用的技术,在基因数据挖掘和分析中有着广泛的应用,不过面对时下产生的体量越来越大的数据,传统的分析方法效率受到了制约,生物学上急需可以处理各种基因大数据挖掘应用的技术和平台,MLLib是Spark的基本机器学习组件,提供了丰富的机器学习和数据挖掘算法,并且Spark很好地支持迭代计算,分类分析、回归分析、聚类分析、协同过滤都可以在SparkMLlib学习库中找到,并且因为Spark的计算逻辑,使用Spark实现这几个算法时效率都可以得到良好的提高。

聚类分析是基因表达谱分析时经常采用的方法,可以将基因根据聚类的逻辑不一样进行分组。从聚类的数学角度说,差异表达基因的聚类可以将在数学特征上比较相同的聚在一起,而不同簇间的成员表达的意义不同。从生物基因学的角度说,聚类可以将具有相同表达模式或者参与同一信号通路的基因聚在一簇,而不同簇间的基因具有不同的表达模式和参与不同的信号通路。当大量已证明的基因的确被聚在了一簇时(如产物构成同一个蛋白复合体),生物意义就

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档