- 1、本文档共88页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[管理学]第3章聚类分析
* * * * 变量聚类1、计算变量之间的相关系数rij (-1≤dij≤1) ,根据相关系数进行变量合并,如教材案例所示。2、将变量间的相关性转化为距离: dij=1- rij (0≤dij≤2) 则变量间的聚类过程和方法与样本聚类相同。 聚类分析案例 例1:某零件标准长度为18,检验4家供货商提供的产品,得到的数据如表,试对这4家产品聚类。 0.500 18.200 丁 0.002 18.050 丙 0.004 17.997 乙 0.003 18.002 甲 样本标准差 样本均值 供货商 第3步与第4步的相似性水平差距最大,聚类到第3步,样本合并为2类: {甲,乙,丙},{丁} 【例2】美国22家公用事业公司1975年数据如表: X1:固定费用周转率 X2:资本回报率 X3:每千瓦容量成本 X4:年载荷因子 X5:年需求增长 X6:销售量 X7:核能所占百分比 X8:总燃料成本 (1)对22家公司聚类 (2)对8个变量聚类 Virginia 1.306 26.6 10093 5.9 54.3 174 9.3 1.07 United 2.116 0.0 6650 3.5 61.0 204 8.6 1.04 Wisconsin 0.702 41.1 7287 3.5 59.9 148 11.8 1.20 Texas 0.636 0.0 13507 -2.1 54.0 104 11.7 1.16 Southern 1.108 0.0 10140 2.7 56.7 150 12.6 1.05 SanDiego 1.920 8.3 5714 9.0 61.9 136 6.4 0.76 Puget 0.620 0.0 15991 9.2 56.0 252 9.9 1.16 Pacific 1.400 0.9 6468 -0.1 62.2 164 7.6 0.96 Oklahoma 0.588 0.0 9673 1.4 49.8 96 12.0 1.09 Northern 0.527 50.2 7179 6.4 53.7 199 12.7 1.15 NewEngla 1.897 0.0 6154 3.7 62.0 178 10.9 1.13 Nevada 0.768 0.0 17441 6.5 51.5 173 7.5 0.75 Madison 0.623 39.2 6455 2.7 53.0 197 12.4 1.12 Kentucky 0.862 0.0 8406 7.2 60.4 168 13.0 1.34 Idaho 0.309 0.0 13082 3.3 57.0 245 9.2 1.10 Hawaiian 1.652 0.0 7642 2.2 67.6 175 12.2 1.22 Florida 1.241 22.5 11127 -2.2 60.0 111 13.5 1.32 Consolid 2.044 15.6 3300 1.0 51.2 192 8.8 1.49 Common 0.700 34.3 6423 0.3 56.0 168 11.2 1.02 Central 1.058 0.0 9212 3.4 53.0 113 15.4 1.43 Boston 1.555 25.3 5088 2.2 57.9 202 10.3 0.89 Arizona 0.628 0.0 9077 1.6 54.4 151 9.2 1.06 名称 x8 x7 x6 x5 x4 x3 x2 x1 (1)对22家公司聚类 从第18步到第19步,相似性水平减少幅度最大,应聚类到第18步,即聚为4类较好。 (2)对8个变量聚类 从第3步到第4步,相似性水平减少幅度最大,应聚类到第3步,即聚为3类较好。 §4 动态聚类法 系统聚类法是一种比较成功的聚类方法。然而当样本点数量十分庞大时,则是一件非常繁重的工作,且聚类的计算速度也比较慢。比如在市场抽样调查中,有4万人就其对衣着的偏好作了回答,希望能迅速将他们分为几类。这时,采用系统聚类法就很困难,而动态聚类法就会显得方便,适用。 动态聚类使用于大型数据。 动态聚类法 基本思想:选取若干个样品作为凝聚点,计算每个样品和凝聚点的距离,进行初始分类,然后根据初始分类计算其重心,再进行第二次分类,一直到所有样品不再调整为止。 选择凝聚点 分 类 修改分类 分类是否合理 分类结束 Yes No 用一个简单的例子来说明动态聚类法的工作过程。例如我们要把图中的点分成两类。快速聚类的步骤: 1、随机选取两个点 和 作为凝聚点。 2、对于任何点 ,分别计算 3、若
您可能关注的文档
- [管理学]第13章公司重组、破产和清算.ppt
- [管理学]第12章经济发展的挑战.ppt
- [管理学]第12章促销的工具和技巧.ppt
- [管理学]第16章物料需求计划、制造资源计划、企业资源计划.ppt
- [管理学]第14讲排队论方法.ppt
- [管理学]第1章Excel入门.ppt
- [管理学]第1章公共关系学基本概述.ppt
- [管理学]第1章创业概述.ppt
- [管理学]第1章商业银行的起源和发展.ppt
- [管理学]第1章房地产经纪概述.ppt
- 2025年山西省朔州市事业单位招聘考试(职业能力倾向测验)题库1套.docx
- 2025年山东省聊城市行政职业能力测验题库新版.docx
- 2025年山西省晋城市行政职业能力测验模拟试题完美版.docx
- 2025年山西省大同市单招(语文)测试模拟题库附答案.docx
- 2025年山西水利职业技术学院单招(语文)测试模拟题库及完整答案一套.docx
- 2025年山东科技职业学院单招语文测试题库汇编.docx
- 文化娱乐产业投资动态2025年投资组合优化方案.docx
- 2025法规执行案例分析方案企业合规实践指南.docx
- 3D打印材料技术指标评估方案2025.docx
- 2025年山西华澳商贸职业学院单招语文测试题库a4版.docx
文档评论(0)