数据挖掘2015最新精品课程完整课件(第13讲)---聚类分析
Nested Clusters Dendrogram 1 2 3 4 5 6 1 2 3 4 5 最小距离的优势 Original Points Two Clusters 能处理非椭圆形的簇 最小距离的局限 Original Points Two Clusters 对噪声和孤立点敏感 K-平均聚类的细节 初始中心点是随机选择的 每次迭代之后簇往往会发生变化. 中心点一般是该簇的均值. “相似性”一般是通过Euclidean距离, cosine 相似性等来度量的. 在以上这些相似性度量标准下,K-平均聚类一般都会收敛. 复杂性O( n * K * I * d ) n = number of points, K = number of clusters, I = number of iterations, d = number of attributes 两个不同的K-平均聚类 Sub-optimal Clustering Optimal Clustering Original Points K-平均聚类演示 K-平均聚类演示 K-平均聚类的评价 误差的平方和(Sum of Squared Error, SSE)是最基本的方法。 对每个点,其差指该点与其所在簇间的距离 计算所有的差,并对这些结果平方求和. X是簇Ci 内的点,mi 是代表簇Ci 的点 mi 可取簇的均值 给定两
您可能关注的文档
最近下载
- TCCIAT 0074-2023 排水管道紫外光固化修复施工和验收技术规程.pdf VIP
- 2026入团考试必刷156题(含答案解析高频考点版).docx
- T_CSPSTC 127-2023 城镇排水管道封堵施工技术规程.pdf VIP
- 2026年中考第二次模拟考试:化学二模模拟卷(辽宁专用)(考试版).docx VIP
- 2023年普通高等学校招生全国统一考试(新课标2卷)地理试题 .pdf VIP
- 线性代数(第六版)赵树嫄课后习题答案.pdf VIP
- 2024《年产100吨植物乳杆菌菌剂生产线设计》10000字.docx VIP
- 2025年神东钳工考试试题及答案.docx VIP
- 2026年建筑企业安全生产合规培训课件与工地风控方案.pptx
- 餐厅厨房4D管理.pptx VIP
原创力文档

文档评论(0)