- 2
- 0
- 约5.74千字
- 约 38页
- 2023-09-18 发布于江苏
- 举报
聚类分析K-means算法 李广明2023/9/171
聚类分析概念聚类与分类的不同在于:分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的要求,则代价非常大,这时候可以考虑使用聚类算法。聚类属于无监督学习,相比于分类,聚类不依赖预定义的类和类标号的训练实例。 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。2023/9/172
聚类算法可以用来完成对l维特征向量的分组。对应于相同地面类型的点,如水,将其聚类在一起形成一组。一旦这样分组以后,分析人员就可以通过每一组中的样本点和地面数据的参考信息相联系来识别地面类型。2023/9/173
聚类分析中的数据类型2023/9/174
相异度计算2023/9/175
区间标度变量2023/9/176
对象间的相似度和相异度对象间的相似度和相异度是基于两个对象间的距离来计算的。标量也就是无方向意义的数字,也叫标度变量。现在先考虑元素的所有特征属性都是标量的情况。例如,计算X={2,1,102}和Y={1,3,2}的相异度。一种很自然的想法是用两者的欧几里得距离来作为相异度,欧几里得距离的定义如下:其意义就是两个元素在欧氏空间中的集合距离,因为其直观易懂且可解释
您可能关注的文档
- 品质管理大师戴明博.pptx
- 品质管理讲义.pptx
- 品质管理讲座之一品质意识培训.pptx
- 品质管理讲座之一品质意识培训3.pptx
- 品质管理讲座品质意识培训.pptx
- 哈尔滨工程大学自动控制元件XXXX0.pptx
- 哥特建筑之美.pptx
- 售前组织与管理工作76p培训课程.pptx
- 商业伦理与会计职业道德修炼.pptx
- 商业地产市场调研报告国际广场项目定位报告.pptx
- 6.1 亚洲的自然环境特征教学设计( 第2课时)地理七年级下学期商务星球版(2024).docx
- Unit 3 Getting along with others(教学设计)英语译林版2020必修第一册.docx
- Unit 3 Getting along with others Period 3(教学设计)英语译林版2020必修第一册.docx
- Unit 3 Getting along with others Period 4(教学设计)高中英语译林版2020必修第一册.docx
- Unit 5Humans and Nature Period 3(教学设计)高中英语北师大版2019必修第二册.docx
- 第一节 能量的转化与守恒(讲义)物理沪科版2024九年级全一册.docx
- 第19讲 机械能守恒定律及其应用(复习讲义)高考物理一轮复习.docx
- 第11讲 氧化还原反应的应用-氯气制备 新高一化学讲义(鲁科版2019).docx
- 第一章 运动的描述(复习讲义)高中物理人教版2019必修第一册.docx
- 2.1 烷烃-高二化学(人教版2019选择性必修3).docx
原创力文档

文档评论(0)