- 0
- 0
- 约2.88千字
- 约 33页
- 2026-05-28 发布于广东
- 举报
使用K-均值算法进行聚类
学习目标及任务
了解一种基于距离的聚类经典算法---k均值算法,能解释算法的关键环节。
通过剖析案例,了解聚类的基本概念,能举例说明算法的应用场景
某城市要举办一场大型画展,参展的各类画有上千幅。主办方希望根据画的类型,将他们安排到不同的展区。然而画的种类繁多,包括风景画水墨画油画,以及一些叫不出名字、不知其风格的画。
在画展中实现“画以类聚”
聚类算法
分类的前提是必须事先明确知道各个类别的信息,并且保证所有待分类项都有一个类别与之对应。
分类与聚类
聚类在社交网络上的应用
购物平台
短视频平台
手机上的推送
用户在使用手机应用时,系统会自动记录他们的消费习惯、阅读偏好、评论风格,然后按照“物以类聚,人以群分”的思想,将这款手机应用的用户聚合为不同的类型,然后对不同类型的用户“投其所好”,向他们推荐他们可能感兴趣的,从而获得潜在的收益。
聚类在社交网络上的应用
特征
聚类的本质
认识聚类
把特征相似的数据样本放到一起
根据样本间的相似度,将样本分到不同小组,每个小组中的样本特征尽可能相似,让不同小组的样本特征尽可能不相似
剖析k-均值聚类算法
计算特征相似度:
采集特征
形成特征值
计算特征值的距离
2
1
1
核心思想:给定组别数k,选k个组长,然后把所有待分
您可能关注的文档
- 串讲02 第一章 圆与圆的方程 高二数学上学期北师大版选择性必修第一册.pptx
- 第3节 化学反应的速率 第1课时 高中化学鲁科版2019选择性必修1.pptx
- 第1节 铁的多样性 第1课时 高中化学鲁科版2019必修第一册.pptx
- 2.2从函数观点看一元二次方程 高中数学湘教版2019必修第一册.pptx
- 第3节 化学反应的速率 第2课时 高中化学鲁科版2019选择性必修1.pptx
- 7.3.2三角函数的图像和性质(第2课时)高中数学苏教版2019必修第一册.pptx
- 2.3.2一元二次不等式的应用 高中数学湘教版2019必修第一册.pptx
- 4.3.5 matplotlib课件 浙教版高中信息技术必修一.pptx
- 1. 电流 电压 电阻(课件)高中物理教科版2019必修第三册.pptx
- 4.3.3 DataFrame中行列编辑课件 浙教版高中信息技术必修一.pptx
- Unit 3 Getting along with others高中英语译林版2020必修第一册.pptx
- 3.2 分米的认识及单位换算(课件) 三年级上册数学人教版.pptx
- 第五单元 认识11~19(复习课件)高中数学苏教版一年级上册(新教材).pptx
- 2.4.1 分式方程(第1课时) 数学鲁教版五四制八年级上册.pptx
- 第八单元 观察物体(二)(复习课件)数学苏教版三年级上册(新教材).pptx
- 2.2.4 含绝对值不等式的求解(课件)高中数学沪教版2020必修第一册.pptx
- 3.2.4 for 循环、while循环结构语句课件 浙教版高中信息技术必修一.pptx
- 2.2.3 分式不等式的求解(课件)高中数学沪教版2020必修第一册.pptx
- 第六单元 两、三位数除以一位数(期末复习课件)数学苏教版三年级上册(新教材).pptx
- 第六单元 两、三位数除以一位数(复习课件)数学苏教版三年级上册(新教材).pptx
原创力文档

文档评论(0)