第5章机器学习与实现聚类思想与K-均值聚类K-均值聚类应用举例
聚类思想第5章聚类分析主要是使类内的样本尽可能相似,而类之间的样本尽可能相异。聚类问题的一般提法是,设有n个样本的维观测数据组成一个数据矩阵为:其中,每一行表示一个样本,每一列表示一个指标,xij表示第i个样本关于第j项指标的观测值,并根据观测值矩阵X对样本进行聚类。聚类分析的基本思想是:在样本之间定义距离,距离表明样本之间的相似度,距离越小,相似度越高,关系越紧密;将关系密切的聚集为一类,关系疏远的聚集为另一类,直到所有样本都聚集完毕。
K-均值聚类方法第5章K-均值聚类是一种基于原型的、根据距离划分组的算法,其时间复杂度比其他聚类算法低,用户需指定划分组的个数K。其中,K-均值聚类常见距离测度包括欧几里得距离(也称欧氏距离)、曼哈顿距离、切比雪夫距离等。K-均值聚类默认采用欧氏距离进行计算,其公式如下:(表示第个i样本与第个j样本之间的欧氏距离)K-均值聚类算法的直观理解如下:Step1:随机初始化K个聚类中心,即K个类中心向量。Step2:对每个样本,计算其与各个类中心向量的距离,并将该样本指派给距离最小的类。Step3:更新每个类的中心向量,更新的方法为取该类所有样本的特征向量均值。Step4:直到各个类的中心向量不再发生变化为止,作为退出条件。
K-均值聚类方法第5章xi1.51.71.62.1
您可能关注的文档
- Python金融数据分析与挖掘(微课版) 课件 1-1. Python基本数据类型与基本数据结构.pptx
- Python金融数据分析与挖掘(微课版) 课件 1-2. Python公有方法.pptx
- Python金融数据分析与挖掘(微课版) 课件 1-3. Python基本数据结构方法.pptx
- Python金融数据分析与挖掘(微课版) 课件 2-1. 数组创建与操作.pptx
- Python金融数据分析与挖掘(微课版) 课件 2-2. 矩阵与线性代数运算.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-1.序列.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-2.数据框.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-4.常用函数.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-5.常用计算任务.pptx
- 第4章第二节主动运输与胞吞胞吐2026年高一上学期生物人教版必修1.pptx
- 统编版二年级语文下册课件《阅读11 寓言二则》.pptx
- 基因指导蛋白质的合成+—2026学年高一下学期生物人教版必修2.pptx
- 统编版二年级语文下册课件《阅读12 画杨桃》.pptx
- 减数分裂-2025-2026学年高一下学期生物人教版必修2.pptx
- 2.2城镇化(教学课件)-2025-2026学年高中地理必修第二册(人教版2019).pptx
- 统编版二年级语文下册课件《阅读14 古诗二首》.pptx
- 增强儿童免疫力的感冒后护理.pptx
- 7.2 做全球发展的贡献者 课件-2025-2026学年高中政治统编版选择性必修一当代国际政治与经济.pptx
- 统编版二年级语文下册课件《阅读23 黄帝的传说》.pptx
最近下载
- 《廉颇蔺相如列传》ppt课件(60页).pptx VIP
- 泌尿系统与废物排出 单元测试-2024-2025学年冀少版七年级生物下册.pdf VIP
- 企业风险管理实施与内部控制手册(标准版).docx VIP
- 23S519 小型排水构筑物.pdf VIP
- 分部工程、分项工程划分.doc VIP
- DB64_T 2170-2025 在役公路桥梁抗震性能排查与评估技术规范.pdf VIP
- DB64_T 2155-2025 建设工程造价指标指数分类与采集标准.pdf VIP
- DB64_T 2154-2025 建设工程造价咨询成果文件编审标准.pdf VIP
- DB64_T 2153-2025 房屋结构安全风险排查技术规程.pdf VIP
- 防范青少年滥用手麻精药品成瘾性物质宣传教育活动方案.pptx VIP
原创力文档

文档评论(0)