- 6
- 0
- 约4.36千字
- 约 9页
- 2017-08-29 发布于湖北
- 举报
算法杂货铺——k均值聚类(K-means)2010-09-20 20:05 by EricZhang(T2噬菌体), 3664 visits, 网摘, 收藏, 编辑4.1、摘要????? 在前面的文章中,介绍了三种常见的分类算法。分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的要求,则代价非常大,这时候可以考虑使用聚类算法。聚类属于无监督学习,相比于分类,聚类不依赖预定义的类和类标号的训练实例。本文首先介绍聚类的基础——距离与相异度,然后介绍一种常见的聚类算法——k均值和k中心点聚类,最后会举一个实例:应用聚类方法试图解决一个在体育界大家颇具争议的问题——中国男足近几年在亚洲到底处于几流水平。4.2、相异度计算????? 在正式讨论聚类前,我们要先弄清楚一个问题:如何定量计算两个可比较元素间的相异度。用通俗的话说,相异度就是两个东西差别有多大,例如人类与章鱼的相异度明显大于人类与黑猩猩的相异度,这是能我们直观感受到的。但是,计算机没有这种直观感受能力,我们必须对相异度在数学上进行定量定义。????? 设,其中X,Y是两个元素项,各自具有n个可度量特征属性,那么X和Y的相异度定义为:,其中R为实数域。也就是说相异度是两个元素对实数域的
您可能关注的文档
- 园林绿化机械安全管理.doc
- 活动策划范文——校园吉尼斯活动策划幻灯片.doc
- 高德置地集团精华版课件.pptx
- 50梁侧模板计算书.doc
- 国外农村文化产业发展资料资料.doc
- plc电梯梯形图.doc
- 浅谈商业银行企业文化1.ppt
- 第7章_工程监理旁站方案.doc
- 第04节 世界汽车工业发展历程.ppt
- 工序验收记录模板东、中侧台身摘要.doc
- 2026年山东省滨州市惠民县中考化学一模试卷(含答案).pdf
- 2026年山东省济南市历城区中考化学二模试卷(含答案).pdf
- 2026年山东省烟台市福山区中考化学模拟试卷(含答案).pdf
- 2026年山东省临沂市郯城县中考化学一模(含答案).pdf
- 2026年四川省德阳市中江县中考化学二诊试卷(含答案).pdf
- 2026年四川省绵阳市梓潼县中考化学二模试卷(含答案).pdf
- 2026年新疆乌鲁木齐市沙依巴克区中考化学适应性试卷(含答案).pdf
- 2026年重庆市永川区中考化学质检试卷(含答案).pdf
- 2026年重庆市第一中学校中考化学全真模拟试卷(二)(含答案).pdf
- 安徽池州市第二中学等校2025-2026学年高一下学期期中物理试卷A(含答案).pdf
最近下载
- 应聘高校科研人员的工作计划.docx
- 上海新高考数学解析几何 第 20 题试题+解答汇总.docx VIP
- 在线网课学习课堂《雷达原理与系统(中国人民解放军战略支援部队信息工程)》单元测试考核答案.docx VIP
- DLT5210.1-2021电力建设施工质量验收规程(全word表格版)..doc
- 南京信息工程大学2021-2022学年第2学期《线性代数》期末试卷(B卷)及参考答案.docx
- 20251217-中国基金投顾业务洞察报告(2025).pdf VIP
- 卷一 2018年6月英语六级真题及答案.pdf VIP
- HDB3编解码报告_原创精品文档.pdf VIP
- 高考英语完形填空专题集中训练含答案(精选5份).docx VIP
- 南京信息工程大学2022-2023学年第2学期《线性代数》期末试卷(A卷)及参考答案.docx
原创力文档

文档评论(0)