网站大量收购闲置独家精品文档,联系QQ:2885784924

1、SPSS数据的预处理.ppt

  1. 1、本文档共126页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 判别分析 根据华北地区和长江中下游降水年变化的不同特点,根据给定资料,建立新增测站分属何种降水类型的判别方程。并判别青岛、兖州、临沂、徐州、阜阳等中间地带的测站应分属于何种降水类型。 地区 测站 x1 x2 x3 华 北 地1 区 天津 2.45 8.9 12.1 北京 3.46 9.7 14.3 保定 3.26 9.0 12.5 石家庄 3.39 8.5 13.0 太原 2.13 10.6 13.3 五台山 1.80 16.4 18.1 兴县 3.01 10.1 13.3 榆林 3.70 7.8 12.5 张家口 1.82 11.4 12.7 大同 2.05 11.6 12.7 长 江 中 下2 游 地 区 上海 0.74 13.1 10.0 东山 1.01 12.5 11.7 南京 0.87 10.9 11.5 合肥 1.18 10.3 10.1 安庆 0.44 12.3 9.5 九江 0.47 13.6 9.4 汉口 0.61 11.7 8.5 芜湖 0.76 10.5 10.9 溧阳 0.75 11.3 12.2 黄石 0.64 14.0 10.4 判 别 对 象 青岛 1.68 13.7 11.6 兖州 1.75 13.7 10.5 临沂 1.65 10.0 12.0 徐州 1.48 8.3 11.1 阜阳 1.07 8.6 10.9 从表中可知,判别方程为: y=-9.3+2.074X1+0.197X2+0.294X3。 计算 和 求均值 求均值 计算 1E-06 计算 判 别 对 象 测站 x1 x2 x3 yc 青岛 1.68 13.7 11.6 0.29362 兖州 1.75 13.7 10.5 0.1154 临沂 1.65 10.0 12.0 -0.3799 徐州 1.48 8.3 11.1 -1.33198 阜阳 1.07 8.6 10.9 -2.18202 判别归类 yc y0 0.29362 1E-06 华北 0.1154 1E-06 华北 -0.3799 1E-06 长江中下游 -1.33198 1E-06 长江中下游 -2.18202 1E-06 长江中下游 快速样本聚类分析 根据被观测的对象的各种特征,即反映被观测对象的特征的各变量进行分类。当要聚成的类数已知时,使用快速聚类过程可以很快将观测量分到各类中去,其特点是处理速度快,占用计算机内存少。 1.1 根据下表12个地区城市建设指数(用来反映城市风貌的一些指数)。请采用快速样本聚类的方法将这些地区的城市风貌归为8类。(此数据为虚构,仅供演示方法用) X1 X2 X3 X4 X5 X6 X7 X8 地区 人口指数 绿化指数 建设指数 信息指数 文化指数 交通指数 收入指数 流通指数 a 110.2 59.76 8.38 4.49 26.8 16.44 1.99 0.41 b 82.58 50.98 13.4 9.33 21.3 12.36 9.21 1.05 c 83.33 53.39 11 7.52 17.3 11.79 12 0.7 d 71.72 47.72 9.42 6.96 13.12 7.9 6.66 0.61 e 68.91 43.41 22.4 15.3 13.88 12.42 9.01 1.41 f 107.8 62.24 15.6 8.88 31 21.01 11.8 0.16 g 73.18 44.54 23.9 15.2 22.38 9.66 13.9 1.19 h 72.23 47.31 9.48 6.43 13.14 10.43 8.3 1.11 i 84.66 44.05 13.5 7.47 19.11 20.49 10.3 1.76 j 114 41.44 33.2 11.2 48.72 30.77 14.9 11.1 k 74.96 50.13 13.9 9.62 16.14 10.18 14.5 1.21 l 5.6 50.88 5.21 3.89 12.94 9.49 6.77 1.27 从聚类结果可知,地区a为一类;地区b、c、k为一类;地区d、h为一类;地区e和g为一类;地区f为一类;地区j为一类;地区l为一类 系统聚类(分层聚类分析) 由于人们对客观事物的认识是有限的,往往难以找出彼此独立的有代表性的变量,而影响对问题的进一步认识和研究。因此往往先要进行变量聚类,找出彼此独立且有代表性的自变量,而又不丢失大量信息。 (对变量聚类R; 对样本聚类

文档评论(0)

***** + 关注
实名认证
内容提供者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档