- 3
- 0
- 约4.58万字
- 约 22页
- 2017-01-30 发布于河南
- 举报
06聚类析方法与操作
技术资料6:
聚类分析方法与操作
聚类是一种应用非常广泛的数据分析方法,它是统计学的一个分支,目前在诸多领域,包括数据挖掘、图像处理、市场研究等,都能凸显出其重要性。聚类是将一个对象的集合分成不同的类,从而描述数据。通过这种方式,人们能够将密集的和稀疏的区域区分开来,从而发现全局的分布模式,以及数据属性之间有趣的相互关系。
很久以前人们就对聚类方法有所研究。传统的聚类方法主要是基于距离的聚类,例如欧氏距离、切比雪夫距离、马氏距离[1]等。
在今天,聚类分析也是数据挖掘和知识发现领域中的重要课题。迄今为止,人们已经提出了许多数据聚类的算法,试图解决各种领域的聚类问题。
从目前来看,对数据挖掘中聚类方法的研究大都集中于计算机科学领域,更多注重聚类算法的研究,或者对现有聚类方法进行算法上的改进,而很少真正从统计学角度出发对数据挖掘中的聚类问题进行深入分析。若尝试从统计学视角出发,以统计理论为基础,以统计方法与算法相结合为基本思路,将一些现有的优秀统计方法,如因子分析、对应分析等引入数据挖掘领域,则能够使其应用于海量数据的聚类分析。
(一)聚类分析的基本概念
聚类是指将一群物理的或抽象的对象,根据它们之间的相似程度,分为若干组,并使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象则是不相似的。一个聚类就是由彼此相似的一组对象所构成的集合。在很多应用中,我们可以把同一个类的数据
您可能关注的文档
最近下载
- 2026年度河南林业职业学院单招《数学》试卷【考试直接用】附答案详解.docx VIP
- 旅游学概论复习资料.docx
- 作业许可管理规定.docx VIP
- TPI-2021年02月25日:配备DQ500_DQ380_DQ381变速箱的车辆变速箱故障指示灯亮起并存储事件存储器条目P173500_P173600-VW(2061782-1).pdf VIP
- 化妆品生产质量管理规范检查要点及判定原则专项考核试卷.doc VIP
- 2026历年高考英语真题高频词汇必备800个(打印版).pdf
- JBT9007-2018 起重滑车-行业标准.pdf VIP
- 第五单元+长江流域的歌+《川江船夫号子》课件 +2025-2026学年粤教花城版初中音乐八年级下册.pptx VIP
- 15D500-15D505 防雷与接地图集(合订本).docx
- 《康复护理学》康复评定神经肌肉电生理检查.ppt VIP
原创力文档

文档评论(0)