- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
讲聚类分析与判别分析演示文稿当前第1页\共有26页\编于星期三\15点
(优选)第讲聚类分析与判别分析当前第2页\共有26页\编于星期三\15点
K-均值聚类法基本原理 当前第3页\共有26页\编于星期三\15点
K均值聚类法迭代终止条件两次迭代计算的聚心之间距离的最大改变量小于初始聚心间最小距离的? 倍到达迭代次数的上限当前第4页\共有26页\编于星期三\15点
K均值聚类的优缺点优点:占有内存少、计算量小、处理速度快,特别适合大样 本的聚类分析 缺点:1、应用范围有限,要求用户指定分类数目; 2、只能对观测量聚类,而不能对变量聚类; 3、所使用的聚类变量必须都是连续性变量。 当前第5页\共有26页\编于星期三\15点
利用如下数据将以下城市按照空气指标分类当前第6页\共有26页\编于星期三\15点
执行【Analyze】 / 【Classify】/【K-means Cluster】命令,弹出如图所示对话框当前第7页\共有26页\编于星期三\15点
结果解读初始聚类中心表当前第8页\共有26页\编于星期三\15点
迭代史表6次终止迭代当前第9页\共有26页\编于星期三\15点
最终聚类中心表当前第10页\共有26页\编于星期三\15点
7.2 系统聚类法 系统聚类法的基本思想是:视观测量(或者变量)各自成为一类;找性质最接近的两个类合并成一个新类,计算在新的类别分划下各类之间的距离;再将性质最接近的两类合并,直到所有模式聚成一类为止。当前第11页\共有26页\编于星期三\15点
系统聚类法优点:既可以对观测量也可以对变量进行聚类;所使用的变量既可以是连续变量也可以是分类变量;提供的距离计算方法和结果显示方法也很丰富。 当前第12页\共有26页\编于星期三\15点
观测量聚类:按照交通情况对各地进行聚类当前第13页\共有26页\编于星期三\15点
执行【Analyze】/【Classify】/【Hierarchical Cluster】命令,弹出如图所示的对话框 当前第14页\共有26页\编于星期三\15点
结果解读聚类进度表当前第15页\共有26页\编于星期三\15点
龙骨图当前第16页\共有26页\编于星期三\15点
变量聚类:按照日照数对月份进行聚类 当前第17页\共有26页\编于星期三\15点
结果解读聚类进度表垂直冰柱图从下往上看当前第18页\共有26页\编于星期三\15点
龙骨图当前第19页\共有26页\编于星期三\15点
7.3 判别分析——Discriminant过程 判别分析简介干什么? 判别样品所属类型的一种统计方法与聚类分析的关系 相同点:解决分类问题 不同点:判别分析是在已知研究对象分成若干类型,对未 知类型的样品进行判别分类 当前第20页\共有26页\编于星期三\15点
判别分析的一般步骤当前第21页\共有26页\编于星期三\15点
常用判别法距离判别法:根据已知分类的数据,分别计算各类的均值(重心),判别准则是任给一次观测,若它与第i类的重心距离最近,就认为它来自第i类。 ◆注意: 距离一般采用马氏距离; 距离判别适合对自变量均为连续变量的情况进行分类; 距离判别对各类的分布无特定的要求。当前第22页\共有26页\编于星期三\15点
Fisher判别法:借助方差分析的思想构造一个判别函数,其中判别系数的确定原则是使得类间的区别最大,而且类内的离差最小,利用判别函数计算出待判样品的判别指标,然后与判别临界值进行比较,判别它的类属。Fisher判别对各类分布、方差都没有限制。但当总体个数较多时,计算比较麻烦。当前第23页\共有26页\编于星期三\15点
Bayes判别法:在考虑先验概率的前提下,利用Bayes公式计算样品来自第i类的后验概率,使用错判损失最小的概念作判别准则,建立判别函数,将待判样品归入来自概率最大类。Bayes判别主要用于多类判别,它要求总体呈多元正态分布.当前第24页\共有26页\编于星期三\15点
逐步判别法:逐步判别法与逐步回归法的基本思想类似,都是逐步引入变量,每引入一个“最重要”的变量进入判别式,同时也考虑较早引入判别式的某些变量,若其判别能力不显著了,应及时从判别式中剔除去,直到判别式中没有不重要的变量需要剔除,且也没有重要的变量要引入为止。当前第25页\共有26页\编于星期三\15点
利用表格中的数据判断待判国家的人口发展水平当前第26页\共有26页\编于星期三\15点
原创力文档


文档评论(0)