(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 聚类分析:附加的问题与算法 在各种领域,针对不同的应用类型,已经开发了大量聚类算法。在这些算法中没有一种算法能够适应所有的数据类型、簇和应用。 事实上,对于更加有效或者更适合特定数据类型、簇和应用的新的聚类算法,看来总是有进一步的开发空间。 我们只能说我们已经有了一些技术,对于某些情况运行良好。其原因是,在许多情况下,对于什么是一个好的簇集,仍然凭主观解释。此外,当使用客观度量精确地定义簇时,发现最优聚类问题常常是计算不可行的。 比较k均值和DBSCAN DBSCAN和k均值都是将每个对象指派到单个簇的划分聚类算法,但是K均值一般聚类所有对象,而DBSCAN丢弃被它识别为噪声的对象。 K均值使用簇的基于原形的概念,而DBSCAN使用基于密度的概念。 DBSCAN可以处理不同大小和不同形状的簇,并且不太受噪声和离群点的影响。K均值很难处理非球状的簇和不同大小的簇。当簇具有很不同的密度时,两种算法的性能都很差。 K均值只能用于具有明确定义的质心(如均值或中位数)的数据。DBSCAN要求密度定义(基于传统的欧几里得密度概念)对于数据是有意义的。
您可能关注的文档
- (全)185埃森哲-关于中国铝业上市公司总体薪酬激励体系设计的初步建议.ppt
- 第3章 销售渠道.pdf
- 《金属建材成型工艺》实验指导书2.doc
- 《经济研究》 魏刚 高级管理层激励与上市公司经营绩效.pdf
- 《深度分销》实战培训1.doc
- 1 材料的力学性能.ppt
- 001 绪论 - 2012.ppt
- 01-第1章 数据库技术.ppt
- 第4章 IIR 滤波器设计.ppt
- 第4章 智能仪器的基本数据处理算法1.ppt
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 宣贯培训(2026年)《GBT 6391-2010 滚动轴承 额定动载荷和额定寿命》标准深度宣贯与技术前瞻培训.pptx VIP
- GBT 6391-2010 滚动轴承 额定动载荷和额定寿命.docx VIP
- 8-2-5-5水泵联合排水试验报告(定稿)[1].doc VIP
- 石城县志(卷之1-9)蒋廷桂 主修,光绪18[1892]-5.pdf VIP
- 卡通角色IP开发合作协议.docx
- 煤矿井下排水系统联合排水试验规范.docx VIP
- 卡通IP授权开发合同协议.docx
- AP宏观经济学(2016年真题)全套含选择题.pdf VIP
- 光的干涉衍射和偏振(教师版).docx VIP
- 聊天记录怎样彻底删除?防止手机聊天记录恢复攻略.docx VIP
原创力文档

文档评论(0)