聚类分析及判别分析实验报告范例.docVIP

下载本文档

56
0
约9.56千字
约 14页
2021-10-17 发布于安徽
举报
版权申诉

聚类分析及判别分析实验报告范例.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

. . . .word.zl. XX电力学院 ?应用多元统计分析? ——判别分析与聚类分析学院： XX：? 学号： 2021年4月我国局部城市经济开展水平的聚类分析和判别分析摘要：本文基于?中国统计年鉴?〔2021年版〕统计数据，寻找评价城市经济开展水平的指标，包括第二三产业开展水平、固定投资额、社会消费零售总额和进出口贸易交流五个指标，利用统计软件SPSS综合考虑各指标，对所选城市进展K-Means 聚类分析，利用Fisher 线性判别待判城市类型，进一步验证所建模型的有效性。关键字：聚类分析，判别分析，SPSS，城市经济开展水平1，引言经过改革开放后三十多年的长足进展，中国城市化已步入中期阶段，步伐加快，质量显著提高。同时，中国城市化又处于期转折点上，上一期行将完毕，下一期将要开场。2021年中国城市化率首次突破50％，意味着中国城镇人口首次超过农村人口，中国城市化进入关键开展阶段，这必将引起深刻的社会变革。根据2021年4月公布的第六次人口普查数据，2021年中国居住城镇的人口接近6.6亿人，城镇化率到达49.68%，全国已有近一半的人口居住在城镇，这意味着中国将进入城镇时代。在过去30多年中，中国的城市化开展取得了很大成绩。然而，总体上中国的城市化道路是城市化滞后于工业化的非均衡道路；是土地城市化快于人口城市化的非规整道路；是以抑制农村、农业、农民的经济利益来支持城市开展，导致不能兼顾效率和公平的非协调道路；是片面追求城市开展的数量和规模，而以生态环境损失为代价的非持续道路；是以生产要素的高投入，而不是投入少、产值高、依靠科技拉动经济增长的非集约道路。传统的城市化存在着诸多弊端，中国未来的城市化必须走出一条具有自身特色的新型城市化道路。具体而言，中国城市经济开展水平受限于地理、环境、资源以及政策等因素的影响，我国不同区域的城市化进程尚存在很大差异。2021年中国城市开展报告中指出，从区域角度看，目前沿海一带城市开展起步早，与国际贸易交流往来频率高，经济开展水平较高，西部地区受到政策的大力扶持，表现出了强劲的增长势头，西部主要城市经济开展水平仅次于沿海兴旺地区，而中部地区城市开展的水平已经落到了最后。显然，通过研究不同城市的经济开展状况和经济类型，指出其开展差异所在，可以为政府在出台相关政策来平衡区域经济开展，缩小不同地区人民生活水平的差异提供一定的指导意见，也为我们深刻理解相关政策提供了扎实的根底。 2，相关统计根底理论 2.1，聚类分析聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的根底上收集数据来分类。从统计学的观点看，聚类分析是通过数据建模简化数据的一种法。传统的统计聚类分析法包括系统聚类法、分解法、参加法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k- 均值、k-中心点等算法的聚类分析工具已被参加到多著名的统计分析软件包中，如 SPSS、 SAS等。本文使用统计软件 SPSS对所收集的数据进展快速聚类，其特点是：在确定类别数量根底上，先给定一个粗糙的初始分类，然后按照某种原那么进展反复修改，直至分类较为合理。在选定类中心作为凝聚点的根底上进展分类和修正的法有很多，本文使用的是K-Means 算法。 K-Means 算法承受输入量k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象〞〔引力中心〕来进展计算的。 K-Means 算法的工作过程说明如下：首先从n个数据对象任意选择 k 个对象作为初始聚类中心；而对于所剩下其它对象，那么根据它们与这些聚类中心的相似度〔距离〕，分别将它们分配给与其最相似的〔聚类中心所代表的〕聚类；然后再计算每个所获新聚类的聚类中心〔该聚类中所有对象的均值〕；不断重复这一过程直到标准测度函数开场收敛为止。一般都采用均差作为标准测度函数。一般而言，k个聚类具有以下特点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。 2.2，判别分析判别分析是