- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章 多元统计分析的应用介绍和多元统计数据的图表示法.ppt
赵世舜
zhaoss@jlu.edu.cn
数学楼 426
第一章多元统计分析的应用和 多元统计数据的图表示法
第一节 引言
什么是多元统计分析
用于的领域
如何处理数据
什么样的方法
第一节 引言
什么是多元统计分析
高维数据
降维
分类
变量间的相互关系
统计推断
第一节 引言
用于的领域
● 教育 ● 服饰
● 医学 ● 经济
● 气象 ● 农业
● 环境 ● 社会科学
● 地址 ●文学
第一节 引言
如何处理数据
第一节 引言
什么样的方法
第二节 轮廓图
图表示法
众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪70年代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。
下表是我国华北地区5个省市2003年城镇居民家庭平均每人全年消费性支出的六项指标数据考虑微机的普及应用,图形的制作则通过电脑实现。轮廓图、矩阵散点图在SPSS中制作,雷达图则在EXCEL中实现。
表 华北5省市城镇居民家庭消费性支出
第二节 轮廓图
轮廓图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。轮廓图用线段的升降来表示变量的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。
轮廓图的作图原理如下:
(1)作平面坐标系,横坐标取p个点,表示p个变量,纵坐
标表示变量取值。
(2)对给定的样品观测值,在p个点的纵坐标上标出相应的
变量取值。
(3)将表示p个变量取值的点连接成一条折线,即得到了表
示一个样品观测数据的折线,n次观测可绘出n条折 线,构成多变量轮廓图。
在SPSS中作轮廓图的方法如下:
(1)将原始数据输入SPSS中。把不同地区当成变量,而把支出指标当成观测。
作轮廓图时的数据组织形式
(2)选择菜单项Graphs→Line,打开Line Charts对话框,如图。在对话框上方的三个选项用于选择轮廓图的形式,由于是这里是多变量作图,所以选择Multiple。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Multiple Line对话框。
Line Charts对话框
(3)在Define Multiple Line对话框中,将代表不同地区的5个变量移入Lines Represent列表框中,将代表支出指标的变量(variable)移入Variable框中。单击OK按钮,即可作出如图所示的轮廓图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。
Define Multiple Line对话框
轮廓图
第五节 雷达图
雷达图是一种较为常用的多变量可视化图形。在雷达图中,每个变量都有它自己的数值轴,每个数值轴都是从中心向外辐射。由于图形就好像雷达荧光屏上的图像,故称其为雷达图。又像蜘蛛网,所以也称蛛网图。
雷达图的作图方法:
(1)作一圆,并按变量的个数p将圆周分成p等分。
(2)连接圆心和各分点,将这p条半径连线依次定义为各变量的坐标轴,并标以适当的刻度。
(3)对给定的一次观测值,将每个变量值分别标在相应的坐标轴上,把p个点相连就形成了一个p边形,n次观测值就可画出n个p边形。
例如,根据前表中的数据,调用EXCEL图表向导,即可制作出如图1~7所示的雷达图。图1画出了北京、天津和河北的雷达图,从图可以看出,三省市消费支出结构有较大差异。北京人均消费支出的各项指标都高,对应面积最大的六边形,其次是天津,在三个省市中面积最小的是河北,天津在居住支出方面与北京较为接近,而在衣着和交通、通讯支出方面则与河北接近。其他支出方面三地存在较大差异。利用雷达图的形状、面积大小,可以对样品进行初始分类分析。
为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很重要的,具体的分配办法要结合分析的问题而定。例如可将要对比的指标分布在左、右或上、下方,以便于对比分析。
当观测次数n较大和指标较多时,画出的雷达图线段太多,图形的效果会很差。为
文档评论(0)