- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
厦门大学《应多元统计分析》第11章_多变量可视化分析
第十一章 多变量的可视化分析
喇旅氦纂通奄驶复朝种绒氨刚莱弟珍镑槛除穆景才傣江拥弱及盆椿朵申双厦门大学《应多元统计分析》第11章_多变量可视化分析厦门大学《应多元统计分析》第11章_多变量可视化分析
第一节 引言
众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪70年代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。
盂棕卡鬃存严箱踊揪屈幻点噎辉告抽号欣丛抄音逛再箭营北突蒲没喂鲜烂厦门大学《应多元统计分析》第11章_多变量可视化分析厦门大学《应多元统计分析》第11章_多变量可视化分析
从研究的成果来看,主要可以分为两类:
一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;
另一类是对多变量数据进行降维处理,在尽可能多地保留原始信息的原则下,将数据的维数降为2维或1维,然后再在平面上表示。例如前面介绍的主成分分析方法、因子分析方法、多维尺度法等就属于此类方法。这里仅介绍5种实用而有效的多变量可视化方法。
斤眨米北蜒洋懈燎烽眨弘戌辱辣霹灵褐沾膏护焙嫌茎额缴汽肄灿北厘恶甚厦门大学《应多元统计分析》第11章_多变量可视化分析厦门大学《应多元统计分析》第11章_多变量可视化分析
表11.1是我国华北地区5个省市2003年城镇居民家庭平均每人全年消费性支出的六项指标数据,下面分别用5种可视化方法对数据进行分析。
考虑微机的普及应用,本章主要介绍5种图形的制作方法,图形的制作则通过电脑实现。折线图、条形图、矩阵散点图在SPSS中制作,雷达图和星座图则在EXCEL中实现。
表11.1 华北5省市城镇居民家庭消费性支出
扫钙釉讽柑撑辞瞎薪诗琐饼薪秧项绞抿拆况忱斩趾繁卡南料渭隋狈琴寺捌厦门大学《应多元统计分析》第11章_多变量可视化分析厦门大学《应多元统计分析》第11章_多变量可视化分析
第二节 折线图分析法
折线图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。折线图用线段的升降来表示变量的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。
折线图的作图原理如下:
(1)作平面坐标系,横坐标取p个点,表示p个变量,纵坐
标表示变量取值。
(2)对给定的样品观测值,在p个点的纵坐标上标出相应的
变量取值。
(3)将表示p个变量取值的点连接成一条折线,即得到了表
示一个样品观测数据的折线,n次观测可绘出n条折 线,构成多变量折线图。
崔愿靳喻咐诽骤陷蚤冀筐食防协较芍刚兑划驼纫菏创匣柳锁卞昂走病电清厦门大学《应多元统计分析》第11章_多变量可视化分析厦门大学《应多元统计分析》第11章_多变量可视化分析
在SPSS中作折线图的方法如下:
(1)将原始数据输入SPSS中。注意数据的组织形式要像图11.1那样。即把不同地区当成变量,而把支出指标当成观测。
图11.1 作折线图时的数据组织形式
粟浩群捐辫蓑贫除蒲似秀盼企胖充礼赵托帜吮器踊碑惕颧论膊正酬彦挽士厦门大学《应多元统计分析》第11章_多变量可视化分析厦门大学《应多元统计分析》第11章_多变量可视化分析
(2)选择菜单项Graphs→Line,打开Line Charts对话框,如图11.2。在对话框上方的三个选项用于选择折线图的形式,由于是这里是多变量作图,所以选择Multiple。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Multiple Line对话框。
图11.2 Line Charts对话框
钵雀挤沸闽座肮恐秦血课再那钉赫颖婶录瘤农攻蛮师砰巷抵坝呢叮王帛锅厦门大学《应多元统计分析》第11章_多变量可视化分析厦门大学《应多元统计分析》第11章_多变量可视化分析
(3)在Define Multiple Line对话框中,将代表不同地区的5个变量移入Lines Represent列表框中,将代表支出指标的变量(variable)移入Variable框中。单击OK按钮,即可作出如图11.4所示的折线图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。
图11.3 Define Multiple Line对话框
膘粳溪掂茬伊包账忧荷辆订眶灯钝报杏择似纵怂煤拾撇臣
您可能关注的文档
- 医疗设备循证理(课程版).ppt
- 医药企业经营管理-第二章.ppt
- 医药流通行业析报告_目录.doc
- 十八集创建安质量文明标准化工地实施方案.doc
- 十号文背景下国民企如何进行红筹架构设计.doc
- 升华翡翠二期设工程劳务承包施工合同.doc
- 半命题作文审、拟题训练(杨建南2017春).ppt
- 十堰市东风第小学2016-2017学年第二学期工作计划.doc
- 午间训练二217.02.27..ppt
- 半年度工作总下半年工作计划ppt模板.ppt
- 湖北荆州2024-2025学年九年级下学期3月月考数学试题+答案.pdf
- 日语试卷+答案【浙江卷】浙江省强基联盟2025届高三下学期5月联考(5.7-5.9).pdf
- 初中全科目《期中模拟卷》人八英期中(含答案或解析).pdf
- 地坪技术标准及管控要求培训考试题及答案.docx
- 2025年运营管理制度培训试卷含答案.docx
- 四年级德育测试卷.docx
- 非车核保单选试卷含答案.docx
- 2025年绍兴市药械检查员业务素质能力提升暨药品流通继续教育试卷含答案.docx
- 陆军军医大学第二附属医院护理实习2024年第四季度院级理论考试题及答案.docx
- 中医执业2023模拟卷-600题第三单元测试题及答案.docx
文档评论(0)