- 0
- 0
- 约6.17千字
- 约 10页
- 2026-07-05 发布于湖北
- 举报
PAGE2
基因数据聚类分析案例
目录
TOC\o1-3\h\u31475基因数据聚类分析案例 1
188111.1SparkMLlib 1
240331.2K均值聚类算法 2
250581.3二分K均值聚类 6
37631.4聚类结果分析 9
聚类集成技术是数据挖掘和基因分析中常用的技术,在基因数据挖掘和分析中有着广泛的应用,不过面对时下产生的体量越来越大的数据,传统的分析方法效率受到了制约,生物学上急需可以处理各种基因大数据挖掘应用的技术和平台,MLLib是Spark的基本机器学习组件,提供了丰富的机器学习和数据挖掘算法,并且Spark很好地支持迭代计算,分类分析、回归分析、聚类分析、协同过滤都可以在SparkMLlib学习库中找到,并且因为Spark的计算逻辑,使用Spark实现这几个算法时效率都可以得到良好的提高。
聚类分析是基因表达谱分析时经常采用的方法,可以将基因根据聚类的逻辑不一样进行分组。从聚类的数学角度说,差异表达基因的聚类可以将在数学特征上比较相同的聚在一起,而不同簇间的成员表达的意义不同。从生物基因学的角度说,聚类可以将具有相同表达模式或者参与同一信号通路的基因聚在一簇,而不同簇间的基因具有不同的表达模式和参与不同的信号通路。当大量已证明的基因的确被聚在了一簇时(如产物构成同一个蛋白复合体),生物意义就
您可能关注的文档
- 《C江水电站厂房及引水建筑物设计》11000字.docx
- 《InSAR技术原理概述》5900字.docx
- 《LED驱动电路设计分析案例》7200字.docx
- 《L市新能源汽车充电设施建设与管理研究(附问卷)》15000字.docx
- 《PFC整流电路设计案例分析》7300字.docx
- 《PVA纤维的随机投放模拟分析》5300字.docx
- 《S大学食堂建筑结构设计》18000字.docx
- 《安全阀阀体零件工艺规程设计案例》9100字.docx
- 《变风量空调的模糊PID控制分析案例》4500字.docx
- 《柴油机可变进、排气门的排气热管理性能研究》4000字.docx
- 绵阳市平武县2025届数学四年级第二学期期末联考试题含解析.docx
- 绵阳市三台县2025届三年级数学第二学期期末模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学下学期期中模拟试题含解析.docx
- 绵阳市三台县2025届四年级数学下学期期末模拟试题(含答案解析).docx
- 绵阳市三台县2025届四年级数学下学期期末模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题含答案.docx
- 绵阳市三台县2025届四年级数学第一学期阶段模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题含解析.docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题(含答案解析).docx
- 绵阳市三台县2025届四年级数学第一学期期中模拟试题含答案解析.docx
原创力文档

文档评论(0)