- 9
- 0
- 约1.08万字
- 约 13页
- 2019-02-11 发布于浙江
- 举报
高斯混合模型详解
聚类的方法有很多种,k-means要数最简单的一种聚类方法了,其大致思想就是把数据分为多个堆,每个堆就是一类。每个堆都有一个聚类中心(学习的结果就是获得这k个聚类中心),这个中心就是这个类中所有数据的均值,而这个堆中所有的点到该类的聚类中心都小于到其他类的聚类中心(分类的过程就是将未知数据对这k个聚类中心进行比较的过程,离谁近就是谁)。其实k-means算的上最直观、最方便理解的一种聚类方式了,原则就是把最像的数据分在一起,而“像”这个定义由我们来完成,比如说欧式距离的最小,等等。想对k-means的具体算法过程了解的话,请看这里。而在这篇博文里,我要介绍的是另外一种比较流行的聚类方法----GMM(Gaussian Mixture Model)。
GMM和k-means其实是十分相似的,区别仅仅在于对GMM来说,我们引入了概率。说到这里,我想先补充一点东西。统计学习的模型有两种,一种是概率模型,一种是非概率模型。所谓概率模型,就是指我们要学习的模型的形式是P(Y|X),这样在分类的过程中,我们通过未知数据X可以获得Y取值的一个概率分布,也就是训练后模型得到的输出不是一个具体的值,而是一系列值的概率(对应于分类问题来说,就是对应于各个不同的类的概率),然后我们可以选取概率最大的那个类作为判决对象(算软分类soft assignment)。而非概率模型,就是指我们学
您可能关注的文档
最近下载
- 2026年浙江省金华市中考语文模拟试卷(一).pdf VIP
- 火力发电厂废水零的排放可行性研究报告.doc VIP
- HIOKI日置 RM3544 RM3545系列电阻表通讯指令手册.pdf VIP
- 我们受特殊保护.pdf VIP
- 准格尔旗生态移民战略研究的中期报告.docx VIP
- 工程测量试题库及详细答案.docx VIP
- 广东省广州市越秀区2024-2025学年七年级下学期期末考试英语试卷(含答案,无听力音频及原文).pdf VIP
- 伤口评估与护理记录.ppt VIP
- FZ T01057.2-2007 纺织纤维鉴别试验方法 第2部分.pdf
- 第八届全国大学生化学实验竞赛笔试题.pdf VIP
原创力文档

文档评论(0)