市场调查与预测:数据分析(聚类分析).ppt

市场调查与预测:数据分析(聚类分析).ppt

  1. 1、本文档共105页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

六、主要的步骤1、选择变量(1)和聚类分析的目的密切相关(2)反映要分类变量的特征(3)在不同研究对象上的值有明显的差异(4)变量之间不能高度相关2、计算相似性相似性是聚类分析中的基本概念,他反映了研究对象之间的亲疏程度,聚类分析就是根据对象之间的相似性来分类的。有很多刻画相似性的测度3、聚类选定了聚类的变量,计算出样品或指标之间的相似程度后,构成了一个相似程度的矩阵。这时主要涉及两个问题:(1)选择聚类的方法(2)确定形成的类数4、聚类结果的解释和证实对聚类结果进行解释是希望对各个类的特征进行准确的描述,给每类起一个合适的名称。这一步可以借助各种描述性统计量进行分析,通常的做法是计算各类在各聚类变量上的均值,对均值进行比较,还可以解释各类产别的原因。如果是变量聚类分析,聚类分析做完之后,各类中仍有较多的指标。也就是说聚类分析并没有达到降维的目的。这就需要在每类中选出一个代表指标,具体做法是:假设某类中有个指标,首先分别计算类内指标之间的相关指数,然后计算某个指标与类内其他指标之间相关指数的平均数,即取最大的,做为该类的代表。例某公司下属30个企业,公司为了考核下属企业的经济效益,设计了8个指标。为了避免重复,需要对这8个指标进行筛选,建立一个恰当的经济效益指标体系。通过计算30个企业8个指标的相关系数距离,数据是1-r2。得如下表:?x1x2??x3?x4x5?x6?x7?x8?x10???????0.600??????0.430.460?????0.470.450.120????0.570.450.230.220???0.380.400.210.290.220??0.310.790.650.700.800.660?0.450.450.270.230.140.190.770试用将它们聚类。x2?x3x4x5?x6?x7?x8根据美国等20个国家和地区的信息基础设施的发展状况进行分类。Call—每千人拥有的电话线数;movel—每千人户居民拥有的蜂窝移动电话数;fee—高峰时期每三分钟国际电话的成本;comp—每千人拥有的计算机数;mips—每千人计算机功率(每秒百万指令);net—每千人互联网络户主数。?国家callmovel??fee?comp?mips?netmeiguo631.6161.90.364032607335.34riben498.4143.23.57176102236.26deguo557.670.602.18199115719.84ruidian684.1281.81.42461666029.39ruishi64493.51.982341362122.68xinjiapo498.4147.52.52841357813.49taiwan469.456.13.6811969111.72hanguo434.5733.369957951.66baxi81.916.33.02198760.52zhili138.68.201.43114111.28moxige92.29.82.613117510.35eluosi174.955.122411010.48bolan1696.53.684017961.45xiongyali262.249.42.666830673.09malaixiya195.588.44.195327341.25taiguo78.627.84.952216620.11yindu13.60.306.2821010.01faguo559.142

文档评论(0)

胖鸥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档