- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
kmeans算法(算法数据代码)
K-means聚类算法 聚类分析概念 1 K-means算法 2 K-means实验-国民健康 3 K-means实验-图像分割 4 K-means实验-商户评级 5 目 录 1.聚类分析概念 聚类与分类的不同在于: 分类简单来说,就是根据文本的特征或属性,划分到已有类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。 聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。聚类不需要对数据进行训练和学习。 2.K-means算法 Q1:K是什么?A1:k是聚类算法当中类的个数。 Summary:Kmeans是用均值算法把数据分成K个类的算法! Q2:means是什么?A2:means是均值算法。 2.K-means算法 距离的定义 欧式距离: N维空间点或向量的距离 曼哈顿距离: 城市街区距离 夹角余弦: 向量方向的差异 相关系数: 信息熵: 2.K-means算法 K-means算法详解 步骤一:取得k个初始中心点 从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类 2.K-means算法 K-means算法详解 Min of three due to the EuclidDistance 步骤二:把每个点划分进相应的簇 根据欧氏距离最小原则,把每个点划分进相应的簇 2.K-means算法 K-means算法详解 Min of three due to the EuclidDistance 步骤三:重新计算中心点 根据均值等方法,重新计算每个类的中心点 2.K-means算法 K-means算法详解 步骤四:迭代计算中心点 重复第二步和第三步 2.K-means算法 K-means算法详解 步骤五:收敛 聚类中心不再发生移动 3.K-means实验-国民健康 数据示意图 国家和地区 婴儿死亡率(‰) 出生时平均预期寿命/岁 1990年 2000年 2006年 1990年 2000年 2006年 中国 36.3 29.9 20.1 68.9 70.3 72 中国香港 77.4 80.9 81.6 孟加拉国 100 66 51.6 54.8 61 63.7 文莱 10 8 8 74.2 76.2 77.1 柬埔寨 84.5 78 64.8 54.9 56.5 58.9 印度 80 68 57.4 59.1 62.9 64.5 印度尼西亚 60 36 26.4 61.7 65.8 68.2 伊朗 54 36 30 64.8 68.9 70.7 以色列 10 5.6 4.2 76.6 79 80 日 本 4.6 3.2 2.6 78.8 81.1 82.3 哈萨克斯坦 50.5 37.1 25.8 68.3 65.5 66.2 朝鲜 42 42 42 69.9 66.8 67 韩 国 8 5 4.5 71.3 75.9 78.5 老 挝 120 77 59 54.6 60.9 63.9 马来西亚 16 11 9.8 70.3 72.6 74 蒙 古 78.5 47.6 34.2 62.7 65.1 67.2 缅 甸 91 78 74.4 59 60.1 61.6 巴基斯坦 100 85 77.8 59.1 63 65.2 菲 律 宾 41 30 24 65.6 69.6 71.4 新 加 坡 6.7 2.9 2.3 74.3 78.1 79.9 斯里兰卡 25.6 16.1 11.2 71.2 73.6 75 泰 国 25.7 11.7 7.2 67 68.3 70.2 越 南 38 23 14.6 64.8 69.1 70.8 埃 及 66.7 40 28.9 62.2 68.8 71 尼日利亚 120 107 98.6 47.2 46.9 46.8 南 非 45 50 56 61.9 48.5 50.7 加 拿 大 6.8 4.9 77.4 79.2 80.4 墨 西 哥 41.5 31.6 29.1 70.9 74 74.5 美 国 9.4 6.9 6.5 75.2 77 77.8 [X,textdata]=xlsread(examp09_04.xls); row=~any(isnan(X),2); X=X(row,
您可能关注的文档
- jQuery经典实例.doc
- J第13章数据库应用1.ppt
- K117+202天桥等截面现浇箱梁技术方案1.doc
- Kettle-Spoon-研究.docx
- k5b计算机联锁理论.ppt
- Kvaser_canking使用说明.doc
- L5-《网络信息制作与发布》网络信息加工与整合2.pptx
- LabVIEW基础第一章.ppt
- lec02 计算机内数据的表示.ppt
- LBZNII电液执行机构说明书.doc
- 2025年江西省鹰潭市公安辅警招聘知识考试题库及答案.docx
- 2025年教师考试时事政治考点试题库(附含参考答案).docx
- 2025年教师职业能力培训考试题及答案.docx
- 2025年吉林省辽源市公安辅警招聘知识考试题库及答案.docx
- 2025年建军节军事知识竞赛多选题库及答案.docx
- 2025年江西省吉安市辅警考试真题及答案.docx
- 2025年江西省辅警招聘《公安基础知识》真题及答案解析.docx
- 2025年纪委监委机关公开遴选公务员考试(面试)题库含答案.docx
- 2025年江西法院书记员招聘笔试真题及答案.docx
- 2025年吉林省通化市辅警招聘《公安基础知识》真题及答案解析.docx
文档评论(0)