KMeans算法实战:基于啤酒数据集简单聚类分析.pdfVIP

  • 0
  • 0
  • 约5.7千字
  • 约 16页
  • 2026-05-12 发布于北京
  • 举报

KMeans算法实战:基于啤酒数据集简单聚类分析.pdf

kmeans算法实战

简单聚类

数据集为20种啤酒,酒的属性包括:calories(卡路里)、sodium(钠)、alc(酒精)、cost。

我们不需要y,所以我们只需要设置X就可以:

X=啤酒[[卡路里,钠含量,含量,成本]]

我们创建两个kmeans模型,聚类簇数分别设置为3和2。

从sklearn.cluster导入KMeans

km=KMeans(n_clusters=3).fit(X)

km2=KMeans(n_clusters=2).fit(X)

.labels_属性可以表示所有数据所属的簇:

array([0,0,0,0,0,0,0,0,1,1,0,1,0,0,0,2,0,0,2,1])

第一个数据属于第0个类别...

我们可以检查聚类后的数据是否符合实际情况:

kmeans算法实战

简单聚类

数据集为20个酒啤酒,酒的属性包括:calories(卡路里)、sodium(钠)、alcohol()、cost

我们不需要y,所以我们只需要设置X就可以:

X=beer[[calories,sodium,alcohol,cost]]

我们创建两个kme

文档评论(0)

1亿VIP精品文档

相关文档