- 1、本文档共105页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
六、主要的步骤1、选择变量(1)和聚类分析的目的密切相关(2)反映要分类变量的特征(3)在不同研究对象上的值有明显的差异(4)变量之间不能高度相关2、计算相似性相似性是聚类分析中的基本概念,他反映了研究对象之间的亲疏程度,聚类分析就是根据对象之间的相似性来分类的。有很多刻画相似性的测度3、聚类选定了聚类的变量,计算出样品或指标之间的相似程度后,构成了一个相似程度的矩阵。这时主要涉及两个问题:(1)选择聚类的方法(2)确定形成的类数4、聚类结果的解释和证实对聚类结果进行解释是希望对各个类的特征进行准确的描述,给每类起一个合适的名称。这一步可以借助各种描述性统计量进行分析,通常的做法是计算各类在各聚类变量上的均值,对均值进行比较,还可以解释各类产别的原因。如果是变量聚类分析,聚类分析做完之后,各类中仍有较多的指标。也就是说聚类分析并没有达到降维的目的。这就需要在每类中选出一个代表指标,具体做法是:假设某类中有个指标,首先分别计算类内指标之间的相关指数,然后计算某个指标与类内其他指标之间相关指数的平均数,即取最大的,做为该类的代表。例某公司下属30个企业,公司为了考核下属企业的经济效益,设计了8个指标。为了避免重复,需要对这8个指标进行筛选,建立一个恰当的经济效益指标体系。通过计算30个企业8个指标的相关系数距离,数据是1-r2。得如下表:?x1x2??x3?x4x5?x6?x7?x8?x10???????0.600??????0.430.460?????0.470.450.120????0.570.450.230.220???0.380.400.210.290.220??0.310.790.650.700.800.660?0.450.450.270.230.140.190.770试用将它们聚类。x2?x3x4x5?x6?x7?x8根据美国等20个国家和地区的信息基础设施的发展状况进行分类。Call—每千人拥有的电话线数;movel—每千人户居民拥有的蜂窝移动电话数;fee—高峰时期每三分钟国际电话的成本;comp—每千人拥有的计算机数;mips—每千人计算机功率(每秒百万指令);net—每千人互联网络户主数。?国家callmovel??fee?comp?mips?netmeiguo631.6161.90.364032607335.34riben498.4143.23.57176102236.26deguo557.670.602.18199115719.84ruidian684.1281.81.42461666029.39ruishi64493.51.982341362122.68xinjiapo498.4147.52.52841357813.49taiwan469.456.13.6811969111.72hanguo434.5733.369957951.66baxi81.916.33.02198760.52zhili138.68.201.43114111.28moxige92.29.82.613117510.35eluosi174.955.122411010.48bolan1696.53.684017961.45xiongyali262.249.42.666830673.09malaixiya195.588.44.195327341.25taiguo78.627.84.952216620.11yindu13.60.306.2821010.01faguo559.142
您可能关注的文档
- 神经生物学:老年痴呆的病理机制和防治基础.pptx
- 生物化学与分子生物学:第一章 蛋白质结构与功能.pptx
- 软件配置管理课件:第2章 常用重构技巧.ppt
- 商法总论与公司法:商法概述 .ppt
- 审计学:第十三章 销售与收款循环审计.ppt
- 审计学:风险评估.ppt
- 生物化学:第十章 糖类代谢.ppt
- 生物课件:免疫调节.ppt
- 生物课件:通过激素调节.ppt
- 生物医学科研:第七章 结果整理和统计.ppt
- 2024至2030年中国人造棉面料行业投资前景及策略咨询报告.docx
- 重庆市渝中区遴选公务员2024年国家公务员考试考试大纲历年真题10340笔试历年典型考题及解题思路附.docx
- 2024至2030年中国甲基苯乙酮行业深度调研及发展预测报告.docx
- 2024至2030年中国羚羊角类饮片行业深度调查与前景预测分析报告.docx
- 重庆市面向中国农业大学定向选调2024届大学毕业生2024年国家公务员考试考试大纲历年真题14笔试历.docx
- 重庆市面向西北工业大学定向选调2024届大学毕业生00笔试历年典型考题及解题思路附答案详解.docx
- 中国不动杆菌感染治疗药行业市场现状分析及竞争格局与投资发展研究报告2024-2029版.docx
- 2024至2030年全球与中国ETL软件市场现状及未来发展趋势.docx
- 初中八年级(初二)生物下册期末考试1含答案解析.docx
- 干簧式继电器项目申请报告.docx
文档评论(0)