- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章聚类分析与判别分析
10.1 聚类分析概述 10.2 层次聚类 10.3 快速聚类 10.4 判别分析 精通SPSS统计分析 第10章 聚类分析与判别分析 本章重点: 聚类分析概述 层次聚类 快速聚类 判别分析 聚类分析的意义 聚类分析说明 10.1.1 聚类分析的意义 聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类分析,所得到的聚类数未必一致。因此,这里所说的聚类分析是一种探索性的分析方法。 对个案的聚类分析类似于判别分析,都是将一些观察个案进行分类。聚类分析时,个案所属的群组特点还未知。即,在聚类分析之前,研究者还不知道独立观察组可以分成多少个类,类的特点也无所得知。 变量的聚类分析类似于因素分析。两者都可用于辨别变量的相关组别。不同在于,因素分析在合并变量的时候,是同时考虑所有变量之间的关系;而变量的聚类分析,则采用层次式的判别方式,根据个别变量之间的亲疏程度逐次进行聚类。 10.1.2 聚类分析说明 聚类分析的方法主要有两种,一种是“快速聚类分析”;另一种是“层次聚类 分析”。如果观察值的个数多或文件非常庞大,则宜使用快速聚类分析方法。 因为观察值数目巨大,层次聚类分析的两种判别图形会过于分散,不容易解释。 判别分析是一种有效的对个案进行分类分析的方法。和聚类分析不同的是,判别分析时,组别的特征已知。如银行为了对贷款进行管理,需要预测哪些类型的客户可能不会按时归还贷款。已知过去几年中,900个客户的贷款归还信誉度,据此可以将各户分成两组:可靠客户和不可靠客户。再通过收集客户的一些资料,如年龄、存款、收入等,将这些资料作为自变量,通过判别分析,建立判别函数。那么,如果有200个新的客户提交贷款请求,就可以利用刚建好的判别函数,对新的客户进行分析,从而判别新的客户是属于可靠客户类还是不可靠客户类。 层次聚类Q型聚类 层次聚类Q型聚类应用实例 层次聚类R型聚类 层次聚类R型聚类应用实例 10.2.1 层次聚类Q型聚类 层次聚类分析中的Q型聚类可使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析。层次聚类分析中,测量样本之间的亲疏程度,一种是样本数据与小类,小类与小类之间的亲疏程度。 样本数据之间的亲疏程度主要通过样本之间的距离、样本间的相关系数来度量。SPSS根据变量数据类型的不同,采用不同的测定亲疏程度的方法。 10.2.2 层次聚类Q型聚类应用实例 经调查得知某班8个学生入学时的语文成绩和中期测试语文成绩,现要求对这8名学生的语文成绩进行聚类,聚类的依据是入学语文成绩和第一次考试的语文成绩。 10.2.4 层次聚类R型聚类 层次聚类R型聚类是对研究对象的观察变量进行分类,它使具有共同特征的变量取在一起,以便可以从不同类中分别选出具有代表性的变量作为分析,从而减少分析变量的个数。其计算公式与Q型聚类计算公式相似,不同的是R型聚类是对变量进行距离的计算,Q型聚类是对样本间进行距离的计算。 10.2.5 层次聚类R型聚类应用实例 该例可以借用层次聚类Q型聚类的实例,分析某班级中语文成绩、数学成绩、化学成绩和外语成绩四门,哪些课程属于同一个类。 快速聚类分析的概念 快速聚类分析的计算过程及公式 快速聚类分析应用实例 快速聚类分析的计算过程如下: 10.3.1 快速聚类分析的概念 快速聚类分析是由用户指定类别数的大样本资料的逐步聚类分析。它先对数据进行初始分类,然后逐步调整,得到最终分类。快速聚类分析的实质是K-Mean聚类。 和层次聚类分析一致,快速聚类分析也以距离为样本间亲疏程度的标志。但两者的不同在于:层次聚类可以对不同的聚类类数产生一系列的聚类解,而快速聚类只能产生固定类数的聚类解,类数需要用户事先指定。 另外,在快速聚类分析中,用户可以自己指定初始的类中心点。如果用户的经验比较丰富可以指定比较合理的初始类点,否则,需要增加迭代的次数,以保证最终聚类结果的准确性。 10.3.2 快速聚类分析的计算过程及公式 在SPSS中确定 个类的初始类中心点。SPSS会根据样本数据的实际情况,选择 个由代表性的样本数据作为初始类中心。初始类中心也可以由用户自行指定,需要指定 组样本数据作为初始类中心点。 1.指定聚类的类数 2. 确定中心点 接着,SPSS重新确定 个类的中心点。SPSS计算每个变量的变量值均值,并以均值点作的类
您可能关注的文档
- 第十七次课-二次型及其标准形的化简上传教案.ppt
- 第十一课宋朝的社会生活.ppt
- 第十一课希腊先哲的精神觉醒﹝岳麓版﹞﹝课件8﹞.ppt
- 第十一讲目标市场营销﹝一﹞﹝2课时﹞.ppt
- 第十一课时整理和复习﹝一﹞.ppt
- 第十七章对象约束语言.ppt
- 第十七章节API编程和MFC框架简介.ppt
- 第十一课﹝邓稼先﹞.ppt
- 第十七章节-进出口合同的履行.ppt
- 第十七章节第四节总需求总供给模型对现实的解释.ppt
- 半导体材料性能提升技术突破与应用案例分析报告.docx
- 半导体设备国产化政策支持下的关键技术突破与应用前景报告.docx
- 剧本杀市场2025年区域扩张策略研究报告.docx
- 剧本杀行业2025人才培训体系构建中的市场需求与供给分析.docx
- 剧本杀行业2025年人才培训行业人才培养模式创新与探索.docx
- 剧本杀行业2025年内容创作人才需求报告.docx
- 剧本杀行业2025年区域市场区域剧本市场消费者满意度与市场竞争力研究报告.docx
- 剧本杀市场2025年区域竞争态势下的区域合作策略分析报告.docx
- 剧本杀行业2025人才培训与行业人才培养模式创新.docx
- 剧本杀行业剧本创作人才心理素质培养报告.docx
文档评论(0)