[理学]31-多元统计分析.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]31-多元统计分析

3-多元统计分析 处理截面样本数据的有效工具 多元分析包括的主要内容: 多元正态总体的参数估计和假设检验 多元数据图表示法 聚类分析 判别分析 主成分分析 第一节 多元数据图表示法 图形有助于对所研究数据的直观了解,如果能把一些多元数据直接显示在平面图上,便可从图形一目了然地看出多元数据之间的关系,从而帮助形成对数据特质的正确评估与判断。 当只有一、二维数据时,可以使用通常的直角坐标系在平面上点图。当有三维数据时,虽然可以在三维坐标系里点图,但已很不方便,而当维数大于3时,用通常的方法已不能点图。但在许多实际问题中,多元数据的维数都大于3。 自20世纪70年代以来多元数据的图表示法一直是人们所关注的问题,提出不少解决方法,这些方法大体上分为两类: 一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系; 另一类是在尽可能多地保留原数据信息的原则下进行降维,若能使数据维数降至2或1,则可在平面上点图。后者可用后面介绍的主成分法、因子分析法等去解决。 例1 考察北京、上海、陕西、甘肃四个省市人均生活消费支出情况,选取以下五项指标,具体数据如下表(摘自1996年中国统计年鉴): 一、轮廓图 作图步骤为: 作平面坐标系,横坐标取p个点表示p个变量。 对给定的一次观测值,在p个点上的纵坐标(即高度)和它对应的变量取值成正比。 连接p个高度的顶点得一折线,则一次观测值的轮廓为一条多角折线形。n次观测值可画出n条折线,构成轮廓图。 下图画出四条折线为北京、上海、陕西、甘肃五项指标的数据,即四个省市五项指标的轮廓图。 由轮廓图可以看出:北京、上海的居民生活消费较高且相似。陕西、甘肃生活消费较低且相似。 如果考察的样品较多,画折线时图形中可能出现重复点多,不便于区分哪个样品对应哪条折线,这时最好多用几种颜色或长短虚实等标志来画出折线。 二、雷达图 作图步骤是: 作一圆,并把圆周分为p等分。 连接圆心和各分点,把这p条半径依次定义为各变量的坐标轴,并标以适当的刻度。 对给定的一次观测值,把它的p个分量值分别点在相应的坐标轴上,然后连接成一个p边形,这个p边形就是p元观测值的图示,n次观测值可画出n个p边形。 将上例数据用雷达图表示如下: 这种图形既象雷达荧光屏上看到的图象,也象蜘蛛网,因此称为雷达图或蛛网图。利用雷达图有助于观测多元数据的某些特点,便于进行深入比较分析。例如从上图不难看出北京、上海各种指标都较高,对应着一个面积较大的五边形;而陕西、甘肃各种指标都较低,其图形面积也较小,利用图形和面积大小还可对样品进行初始分类,将北京、上海分为一类,陕西、甘肃分为一类。 当观测次数n较大时,为使图形清晰,每张图可以只画少数几次观测数据,甚至每张图只画一次观测值。为了获得较好的效果,在雷达图中适当分配变量的坐标轴,并选取合适的尺度是十分重要的。值得注意的是,这里坐标轴只有正半轴,因而只能表示非负数据,若有负数据,通过合理变换同样可以制图。在excel等制图软件中可以让计算机来完成或自己设定。 三、调和曲线图 调和曲线图是D.F.Andrewsl972年提出的三角多项式作图法,所以又称为三角多项式图。在多变量分析中,三角多项式图把研究对象看作一个多维空间点,然后把这一空间点展示为平面上的一条曲线,并使其充分保留研究对象所具有的全部信息,以便于研究对象之间的比较。由空间点展示为平面曲线主要借助三角多项式来完成。其思想是把高维空间中的一个样品点对应于二维平面上的一条曲线。 n次观测对应的n条曲线画在同一平面上就是一张调和曲线图。 作调和曲线时一般要借助计算机作图,这种图对聚类分析帮助很大。如果选择聚类统计量为距离的话,同类的曲线非常靠近拧在一起,不同类的曲线拧成不同的束,非常直观。 从数学上看,调和曲线图是一种较好的图示法,因为它具有许多好的性质。 其他多元数据的图表示法: 星座图 脸谱图 树形图 塑像图 面积图 此处不再作更多的介绍。 * * 因子分析 对应分析 多重多元回归分析 典型相关分析 路径分析 多维标度法等 肉禽及制品 文化用品及服务 交通和通讯 医疗保健 住房

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档