- 13
- 0
- 约8.06千字
- 约 8页
- 2021-01-01 发布于海南
- 举报
k-means 聚类算法简介
k-means 算法是一种基于划分的聚类算法,它以 k 为参数,把 n 个数据对象分成 k 个
簇,使簇内具有较高的相似度,而簇间的相似度较低。
1. 基本思想
k-means 算法是根据给定的 n 个数据对象的数据集,构建 k 个划分聚类的方法,每个划
分聚类即为一个簇。该方法将数据划分为 n 个簇,每个簇至少有一个数据对象,每个数据
对象必须属于而且只能属于一个簇。 同时要满足同一簇中的数据对象相似度高, 不同簇中的
数据对象相似度较小。聚类相似度是利用各簇中对象的均值来进行计算的。
k-means 算法的处理流程如下。 首先, 随机地选择 k 个数据对象, 每个数据对象代表一个
簇中心,即选择 k 个初始中心;对剩余的每个对象,根据其与各簇中心的相似度(距离) ,
将它赋给与其最相似的簇中心对应的簇; 然后重新计算每个簇中所有对象的平均值, 作为新
的簇中心
您可能关注的文档
- 2021年B4U3--Newwords新视野单词.pdf
- 2021年B4U7--Newwords新视野单词.pdf
- 2021年B4U8--Newwords新视野单词.pdf
- 2021年C语言百钱买百鸡(百钱百鸡,百鸡问题).pdf
- 2021年C语言常见改错.pdf
- 2021年C语言程设计实验与案例周信东主编机试试卷003.pdf
- 2021年C语言二分查找算法,折半查找算法.pdf
- 2021年C语言分块查找算法,索引顺序查找算法.pdf
- 2021年C语言矩阵转置.pdf
- 2021年C语言求定积分.pdf
- 《过程控制与集散系统》课件——5.3 串级控制的表示和特点.pptx
- 2025 东方日升公司宣传册中文 Risen catalogue CN 20251105.pdf
- 云南省玉溪一中2025一2026学年下学期高三适应性测试(一)语文试卷.docx
- 云南省玉溪一中2025一2026学年下学期高三适应性测试(一)数学试卷.docx
- 云南省玉溪一中2025一2026学年下学期高三适应性测试(一)语文试卷.pdf
- 山东省2026年4月高三核心素养评估检测历史试卷.docx
- 浙江省宁波市2025-2026学年高三下学期高考模拟考试(二模)语文试卷(含答案).docx
- 浙江省宁波市2025-2026学年高三下学期高考模拟考试(二模)数学试卷(含答案).pdf
- 云南省玉溪一中2025一2026学年下学期高三适应性测试(一)数学试卷.pdf
- 山东省2026年4月高三核心素养评估检测历史试卷.pdf
原创力文档

文档评论(0)