kmeans算法(算法+数据+代码)讲述.ppt

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
kmeans算法(算法数据代码)讲述

K-means聚类算法 聚类分析概念 1 K-means算法 2 K-means实验-国民健康 3 K-means实验-图像分割 4 K-means实验-商户评级 5 目 录 1.聚类分析概念 聚类与分类的不同在于: 分类简单来说,就是根据文本的特征或属性,划分到已有类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。 聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。聚类不需要对数据进行训练和学习。 2.K-means算法 Q1:K是什么?A1:k是聚类算法当中类的个数。 Summary:Kmeans是用均值算法把数据分成K个类的算法! Q2:means是什么?A2:means是均值算法。 2.K-means算法 距离的定义 欧式距离: N维空间点或向量的距离 曼哈顿距离: 城市街区距离 夹角余弦: 向量方向的差异 相关系数: 信息熵: 2.K-means算法 K-means算法详解 步骤一:取得k个初始中心点 从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类 2.K-means算法 K-means算法详解 Min of three due to the EuclidDistance 步骤二:把每个点划分进相应的簇 根据欧氏距离最小原则,把每个点划分进相应的簇 2.K-means算法 K-means算法详解 Min of three due to the EuclidDistance 步骤三:重新计算中心点 根据均值等方法,重新计算每个类的中心点 2.K-means算法 K-means算法详解 步骤四:迭代计算中心点 重复第二步和第三步 2.K-means算法 K-means算法详解 步骤五:收敛 聚类中心不再发生移动 3.K-means实验-国民健康 数据示意图 国家和地区 婴儿死亡率(‰) 出生时平均预期寿命/岁 1990年 2000年 2006年 1990年 2000年 2006年 中国 36.3 29.9 20.1 68.9 70.3 72 中国香港 77.4 80.9 81.6 孟加拉国 100 66 51.6 54.8 61 63.7 文莱 10 8 8 74.2 76.2 77.1 柬埔寨 84.5 78 64.8 54.9 56.5 58.9 印度 80 68 57.4 59.1 62.9 64.5 印度尼西亚 60 36 26.4 61.7 65.8 68.2 伊朗 54 36 30 64.8 68.9 70.7 以色列 10 5.6 4.2 76.6 79 80 日 本 4.6 3.2 2.6 78.8 81.1 82.3 哈萨克斯坦 50.5 37.1 25.8 68.3 65.5 66.2 朝鲜 42 42 42 69.9 66.8 67 韩 国 8 5 4.5 71.3 75.9 78.5 老 挝 120 77 59 54.6 60.9 63.9 马来西亚 16 11 9.8 70.3 72.6 74 蒙 古 78.5 47.6 34.2 62.7 65.1 67.2 缅 甸 91 78 74.4 59 60.1 61.6 巴基斯坦 100 85 77.8 59.1 63 65.2 菲 律 宾 41 30 24 65.6 69.6 71.4 新 加 坡 6.7 2.9 2.3 74.3 78.1 79.9 斯里兰卡 25.6 16.1 11.2 71.2 73.6 75 泰 国 25.7 11.7 7.2 67 68.3 70.2 越 南 38 23 14.6 64.8 69.1 70.8 埃 及 66.7 40 28.9 62.2 68.8 71 尼日利亚 120 107 98.6 47.2 46.9 46.8 南 非 45 50 56 61.9 48.5 50.7 加 拿 大 6.8 4.9 77.4 79.2 80.4 墨 西 哥 41.5 31.6 29.1 70.9 74 74.5 美 国 9.4 6.9 6.5 75.2 77 77.8 [X,textdata]=xlsread(examp09_04.xls); row=~any(isnan(X),2); X=X(row,

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档