CH11 聚类分析.docVIP

  • 6
  • 0
  • 约1.65千字
  • 约 11页
  • 2017-01-06 发布于贵州
  • 举报
错误订正: CH4 抽样调查方法——二、 抽样调查作业错误 应改为: 给大家带来的不便,非常抱歉~ CH11 聚类分析 1、下表给出6种精神治疗药物的3种临床测量指标数据,请利用谱系图做聚类分析(分别采用最短距离法和最长距离法) 变量 药物 吸入量 疗效 依赖性 速可眠 5 9 20 LSD 6 11 2 安定 4 5 20 吗啡 6 9 46 仙人球毒碱 5 7 1 酒精 3 1 12 令速可眠、LSD、安定、吗啡、仙人球毒碱和酒精分别为,根据距离公式: 首先构造距离矩阵: 一)最短距离法:(聚合指数) 1各自成为一类: ,,平台高度: 2 得新距离矩阵为: ,,平台高度: 3 得新距离矩阵为: ,,平台高度: 4 得新距离矩阵为: ,,平台高度: 5 得新距离矩阵为: ,,平台高度: 所有点已聚为一类,停止计算。 谱系图: 二)最长距离法:(聚合指数) 1、各自成为一类: ,,平台高度: 2、 得到新矩阵: ,,平台高度: 3、 新的距离矩阵为: ,平台高度: 4、 新距离矩阵为: ,平台高度: 5、 新距离矩阵为: ,平台高度: 所有点已聚为一类,停止计算。 谱系图: 2. 下表给出24名优秀田径运动员的7项全能项目得分之间的相关系数。试对这7个指标(变量)进行聚类分析。 变量 100米栏 跳高 铅球 200米 跳远 标枪 800米 100米栏 1.00 跳高 0.45 1.00 铅球 0.68 0.47 1.00 200米 0.85 0.33 0.57 1.00 跳远 0.81 0.54 0.59 0.81 1.00 标枪 0.32 0.22 0.69 0.31 0.33 1.00 800米 0.57 0.15 0.38 0.68 0.50 0.06 1.00 采用最大系数法进行聚类 设100米栏,跳高,铅球,200米,跳远,标枪和800米分别为 , (2)新的分类 , (3)新的分类 , (4)新的分类 , (4)新的分类 , (5)新的分类 , 谱系图: 3、请采用 K-means 聚类法,对“管理期刊的数据进行分类分析。并配合PCA的主平面图,解释各类的意义。 (略) CH12 判别分析 1、分别用等方差法和不等方差法建立数据组I、II 的距离判别规则: 解:(1)等方差法: 只需考查 此题中 , 因为 所以 即 (2)不等方差法: 判别阈值 此题中 ,计算可得 由 此题中 2.对数据disc.sav,只选取少数两三个变量进行计算。看结果有什么不同。试着在SPSS上利用各种不同的选项。(略) 3.讨论判别分析和聚类分析有什么不同? 判别分析没有有类别目标,属于有导师的模型 聚类分析事先没有类别,属于无导师的模型. CH13 时间序列分析 某地区国内生产总值,1993~1995年3年间平均每年递增10%,1996~1999年4年间平均递增12%,2000~2004年5年间平均每年递增9%。计算: (1)该地区11年来社会总产值共增长了多少? (2)年平均增长速度是多少 解:1)设1993年的数据为基期1 2)年平均增长速度为

文档评论(0)

1亿VIP精品文档

相关文档