- 14
- 0
- 约1.46万字
- 约 19页
- 2016-08-18 发布于江苏
- 举报
技术资料6:
聚类分析方法与操作
聚类是一种应用非常广泛的数据分析方法,它是统计学的一个分支,目前在诸多领域,包括数据挖掘、图像处理、市场研究等,都能凸显出其重要性。聚类是将一个对象的集合分成不同的类,从而描述数据。通过这种方式,人们能够将密集的和稀疏的区域区分开来,从而发现全局的分布模式,以及数据属性之间有趣的相互关系。
很久以前人们就对聚类方法有所研究。传统的聚类方法主要是基于距离的聚类,例如欧氏距离、切比雪夫距离、马氏距离[1]等。
在今天,聚类分析也是数据挖掘和知识发现领域中的重要课题。迄今为止,人们已经提出了许多数据聚类的算法,试图解决各种领域的聚类问题。
从目前来看,对数据挖掘中聚类方法的研究大都集中于计算机科学领域,更多注重聚类算法的研究,或者对现有聚类方法进行算法上的改进,而很少真正从统计学角度出发对数据挖掘中的聚类问题进行深入分析。若尝试从统计学视角出发,以统计理论为基础,以统计方法与算法相结合为基本思路,将一些现有的优秀统计方法,如因子分析、对应分析等引入数据挖掘领域,则能够使其应用于海量数据的聚类分析。
(一)聚类分析的基本概念
聚类是指将一群物理的或抽象的对象,根据它们之间的相似程度,分为若干组,并使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象则是不相似的。一个聚类就是由彼此相似的一组对象所构成的集合。在很多应用中,我们可以把同一个类的数
您可能关注的文档
- (精简)白米乡发展战略的研究.doc
- (最新版本080719)现代金属切削和数控刀具 (NXPowerLite).ppt
- 《辩证唯物论》 2013高考试题.ppt
- 《电喷发动机空气供给系统故障和维修》毕业论文.doc
- 《管理信息系统的分析和设计》(公共课)实验1-2.doc
- 《广告设计和制作专业》教学基本要求-终稿.doc
- 《科学的研究和沟通协调能力提升》答案全选录.doc
- 《面向对象系统的分析和设计》课程设计指导.doc
- 【创新设计】2013届高中政治人教版必修四3-3-1.ppt
- 【全国百强校】江西师大附中、鹰潭一中2016届高三下学期第一次联考语文试题.doc
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- J B∕T 12039-2015 柴油机电控共轨喷油器电磁执行器技术条件.pdf VIP
- 2026年高考政治一轮复习:选择性必修三《逻辑与思维》主观题 专项练习题汇编(含答案).docx
- 《氨水泄漏专项应急处理预案》范本(3篇).doc VIP
- ppg配套油漆说明书sigmadur-550h中文版.pdf VIP
- PLC编程与应用(S7-1200)(第二版)教学课件项目六 任务准备(修改).pptx VIP
- 安徽省天一大联考皖豫名校联盟2024-2025学年高三4月份检测含答案(10科试卷).pdf
- SY∕T 6246-2022 可控震源使用技术规范.pdf
- PLC编程与应用(S7-1200)(第二版)教学课件项目9 任务3(修改).pptx VIP
- OBE教育理念实施与人才培养方案.ppt VIP
- (2024年高考真题)2024年普通高中学业水平等级性考试生物试卷 山东卷(含答案).doc VIP
原创力文档

文档评论(0)