统计专业实验实验06聚类分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计专业实验实验06聚类分析.doc

重庆工商大学数学与统计学院 《统计专业实验》课程 实验报告 实验课程: :统计专业实验 指导教师: : 叶 勇 专业班级: : 统计专业二班 学生姓名: : 殷婷 学生学号: : 2010101217 实验报告 实验项目 实验六聚类分析 实验日期 2013-4-5 实验地点 80608 实验目的 了解聚类分析的原理, 并掌握聚类分析的方法和过程。 实验内容 根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数 据,对世界20个国家和地区进行聚类分析,并对结果进行判断。数据见实验指 导书。 根据2008年企国各省市居民消费结构,进行聚类分析。 对重庆市各区县的经济发展类型进行聚类分析。 实验思考题解答: 变量的测度类型有哪些? 变量的测度类型包括间距尺度、有序尺度和名义尺度 系统聚类法的思想是什么? 系统聚类法的基本思想是距离相近的样品(或变量)先聚成类距离相远的后聚成类过程 一直进行下去每个样品(或变璧)总能聚到合适的类屮。 最短距离法是不是一种优良的系统聚类方法,为什么?它适合于什么形态类的聚类? 不是因为最短距离法有链接聚合的趋势合并之后新类与其他类的距离缩短会形成聚 类延伸的情况。适合于样品散点图呈条形甚至是S形的类。 组间联结法和组内联结法都是计算所有样本对的平均距离,请说明其区别? 组间平均链锁法定义两个小类之间的距离为所有样木对间的平均距离。组内平均 链锁法是对所有样本对之间的距离求平均值包括小类之间的样本对、小类内的样 本对组间联结法利用了所有样本对距离的信息克服了最短距离和最长距离中的距 离易受极端值影响的弱点。组类联结法与组间联结法相比它在聚类的每一步都考虑 了类内部相似性的变化。 实验运行程序、基本步骤及运行结果: 根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数据,对 世界20个国家和地区进行聚类分析,并对结果进行判断。 根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数据如表: 其中:call —每千人拥有电话线,movecaU —每千户居民蜂窝移动电话数 fee—高峰时每3分钟国际电话成本,computer —每千人拥有计算机数 mips—每千人屮计算机运算功率(每秒百万指令),net —每千人互联网用户数 no 国家 Call movecall fee computer mips Net 1 美国 631.6 161.9 0.36 403 26073 35.34 2 日本 498.4 143.2 3.57 176 10223 6.26 3 德国 557.6 70.6 2.18 199 11571 9.48 4 瑞典 684.1 281.8 1.4 286 16660 29.39 5 瑞士 644 93.5 1.98 234 13621 22.68 6 丹麦 620.3 248.6 2.56 296 17210 21.84 7 新加坡 498.4 147.5 2.5 284 13578 13.49 8 屮国台湾 469.4 56.1 3.68 119 6911 1.72 9 韩国 434.5 73 3.36 99 5795 1.66 10 巴西 81.9 16.3 3.02 19 876 0.52 11 智利 138.6 8.2 1.4 31 1411 1.28 12 墨两哥 92.2 9.8 2.61 34 1751 0.35 13 俄罗斯 174.9 5 5.12 24 1101 0.48 14 波兰 169 6.5 3.68 40 1796 1.45 15 匈牙利 262.2 49.4 2.66 68 3067 3.09 16 马来两亚 195.5 88.4 4.19 53 2734 1.25 17 泰国 78.6 27.8 4.95 22 1662 0.11 18 印度 13.6 0.3 6.28 2 101 0.01 19 法国 559.1 42.9 1.27 201 11702 4.76 20 英国 521.1 122.5 0.98 248 14461 11.91 步骤?? 在SPSS中输入数据,每个数据指标为一个变量; 选择SPSS的聚类分析功能 Analyze-Classify-Hierarchical cluster Analysis 选择六个信息基础变量到分析变量框中,“国家”到案例标识变量框中; 指定聚类方法和输出格式。 注意对距离的选择和聚类方法的选择。 将主要的步骤和SPSS的运行结果记录下来,根裾树形图或冰柱图对结论进行分析。 组间平均连锁法: Agglomeration Schedule Stage Cluster Combined Coefficients Stage Cluster First Appears Next

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档