聚类算法概览与实践:从基础到应用.pptx

聚类算法概览与实践:从基础到应用.pptx

聚类算法

聚类算法简介聚类算法API的使用

知道什么是聚类了解聚类算法的应用场景知道聚类算法的分类

聚类算法–概念什么是聚类算法?聚类算法是一类无监督学习方法,旨在将数据划分为若干组(簇),使得同一簇内的样本相似度高,而不同簇间的样本差异大。根据样本之间的相似性,将样本划分到不同的类别中;不同的相似度计算方法,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。聚类算法的目的是在没有先验知识的情况下,自动发现数据集中的内在结构和模式。使用不同的聚类准则,产生的聚类结果不同繁衍方式(胎生、卵生)呼吸方式(肺、腮)生活环境(陆地、两栖、水中)

聚类算法在现实生活中的应用用户画像,广告推荐DataSegmentation搜索引擎的流量推荐恶意流量识别基于位置信息的商业推送新闻聚类,筛选排序图像分割,降维,识别离群点检测,信用卡异常消费发掘相同功能的基因片段

聚类算法分类1.根据聚类颗粒度分类2.根据实现方法分类基于划分的聚类:K-means算法-按照质心(一个簇的中心位置,通过均值计算)分类基于层次的聚类:DIANA(自顶向下)AGNES(自底向上)基于密度的聚类:DBSCAN算法基于图的聚类:谱聚类(SpectralClustering)...

1聚类概念无监督学习算法,主要用于将相似的样本自动归到一个类别中;计算样本和样本之间的相似性,一般使用欧式距

文档评论(0)

1亿VIP精品文档

相关文档