- 7
- 0
- 约4.6千字
- 约 43页
- 2017-09-04 发布于重庆
- 举报
基于距离的方法进行聚类只能发现球状类,当类的形状是任意的时候怎么识别? 下面介绍其中一种常用的算法: 3.4 基于密度的方法(density-based method) 主要有DBSCAN,OPTICS法 思想: 只要临近区域的密度超过一定的阀值,就继续聚类 特点: 可以过滤噪声和孤立点outlier,发现任意形状的类 3.5 基于网格的方法(grid-based method) 把样本空间量化为有限数目的单元,形成一个网络结构,聚类操作都在这个网格结构(即量化空间)上进行 3.6 基于模型的方法(model-based method) 为每个类假定一个模型,寻找数据对给定模型的最佳拟合。 此不详述,有兴趣可以参考《DataMing Concepts and Techniques》即《数据挖掘概念于技术》Jiawei Han Micheline Kamber机械工业出版社 4 不稳定的聚类方法 受所选择变量的影响 如果去掉或者增加一些变量,结果会很不同.因此,聚类之前一定要明确目标,选择有意义的变量。 变量之间的相关性也会影响聚类结果,因此可以先用主成分或因子分析法把众多变量压缩为若干个相互独立的并包含大部分信息的指标,然后再进行聚类。 4 不稳定的聚类方法 输入参数凭主观导致难以控制聚类的质量 很多聚类算法要求输入一定的参数,如希望产生的类的数目,使得聚类的质量难以控制
您可能关注的文档
- (来源:信达澳银基金研究咨询部).pdf
- 《基本医疗服务范围界定及其实施路径》.doc
- 1、竖直放置的平行光滑导轨,其电阻不计,磁场方向如右图所….doc
- 1、源及其定量描述2、电磁场的基本实验定律3、麦克斯韦方.ppt
- 1蛋白质的结构与功能考点:.doc
- 2-4-中波太阳轮经济航速的探索与应用中波公司.doc
- 5大型循环流化床锅炉设备特点及运行特性分析.doc
- 5规划环境影响分析与评价.doc
- 09第九讲定积分的概念与微积分基本定理.doc
- 11常见故障与排除.ppt
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 肝硬化结节影像诊断.ppt VIP
- 自律·自由课件--高中主题班会.pptx VIP
- 《QGDW 11398—2020变电站设备监控信息规范》.pdf VIP
- 肝硬化结节影像诊断.pptx VIP
- 2025年四川对口升学 财经商贸类专业综合理论测试试卷 .pdf VIP
- 2025年全国统一高考化学试卷(全国卷二)及答案.docx VIP
- 2025年南京市城管协管人员招聘笔试备考题库及答案解析.docx VIP
- 监理实施细则(建筑工程).doc
- 2024年南京市六合区城管协管员招聘考试题库及答案.docx VIP
- 第1章 整式的乘除 单元测试卷-2024-2025学年七年级数学下册(含答案).pdf VIP
原创力文档

文档评论(0)