多元统计翼分析及实例讨论.pptVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计翼分析及实例讨论

多元统计分析 全校数模选修课使用 (4 课时) 参考书目 《多元统计分析》于秀林      中国统计出版社 《应用多元统计分析》高惠璇       北京大学出版社  《应用多元统计分析》朱建平      科学出版社  课程概要 1、多元数据图表示法 2、聚类分析 3、判别分析; 4、主成分分析; 5、因子分析; 6、对应分析; 7、典型相关分析; 8、多重多元回归分析; 9、定性资料的统计分析 通过实例了解《多元统计分析》 《多元统计分析》的概述 计算机在《多元统计分析》中的 应用 2012年全国大学生数模竞赛A题分析简介 经验总结 例1、对10位应聘者做智能检验。指标X,Y和Z分别表示数学推理能力,空间想象能力和语言理解能力。 例2、家庭特征(年龄、收入、受教育程度)与家庭消费(外食、电影娱乐)之间的关系 例3、奥运会十项全能运动项目得分数据的因子分析 例4、对应与聚类分析在建筑企业竞争力评价中的应用 例1 对10位应聘者做智能检验。3项指标X,Y和Z分别表示数学推理能力,空间想象能力和语言理解能力。其得分如下,画出它的轮廓(折线)图.选择合适的统计方法对应聘者进行分类。 例1(EXCEL)-样品 例1(EXCEL)-变量 我们直观地来看,这个分类是否合理? 计算4号和6号得分的离差平方和: (21-20)2+(23-23)2+(22-22)2=1 计算1号和2号得分的离差平方和: (28-18)2+(29-23)2+(28-18)2=236 计算1号和3号得分的离差平方和为482,由此可见一般,分类可能是合理的,欧氏距离很大的应聘者没有被聚在一起 聚类分析基本思想简介 例2 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量: 第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度, u2和 v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。 典型相关分析基本思想简介 多元统计分析是以p个变量的n次观测数所组成的数据为依据。 *简化数据结构(降维) 将某些较复杂的数据结构通过变量变换等方法使相互依赖的变量变成互不相关的;将高维空间数据投影成到低维空间数据; *分类与判别(归类) 对所考察观测点(或变量)按相似程度进行分类或归类; *变量间的相互联系 相互依赖关系:分析一个或几个变量的变化是否依赖于另一 些变量的变化;变量间相关关系:分析两组变量相互关系; *多元数据的统计推断 多元正态分布的均值向量与协方差阵的估计及其假设检验; *多元统计分析的理论基础 多维随机变量及其分布,抽样分布 计算机在统计分析中的应用 流行的统计软件:   R语言、SAS、SPSS、EXCEL、 MATLAB统计软件包等; 基本步骤:   数据的组织(数据库结构的建立)   数据的录入   统计分析   结果输出 * * 24 24 24 22 22 26 22 16 18 28 Z 27 29 23 22 23 29 23 22 23 29 Y 22 24 14 16 20 26 21 11 18 28 X 10 9 8 7 6 5 4 3 2 1 应聘者 分析两组变量之间的关系。 典型变量的结构(相关系数) ? U1 U2 X1就餐频率 0.9866 -0.1632 X2看电影频率 0.8872 0.4614 ? ? V1 V2 Y1户主年龄 0.4211 0.8464 Y2家庭收入 0.9822 -0.1101 Y3受教育程度 0.5145 0.3013 两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入, u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的; 百米跑成绩 跳远成绩 铅球成绩 跳高成绩 400米跑成绩 百米跨栏 铁饼成绩 撑杆跳远成绩 标枪成绩 1500米跑成绩 例3 奥运会十项全能运动项目 得分数据的因子分析 通过因子

文档评论(0)

135****1071 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档