- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计分析 喀什师范学院笔记 第四章 多元数据图表示法
第四章 多元数据图表示法 4.1 轮廓图 4.2 雷达图 4.3 调和曲线图 4.4 星座图 本章学习目标 领会作多元数据图的思想。 会作简单的多元数据图形并且会分析图形。 第四章 多元数据图表示法 图形有助于我们对所研究数据的直观了解,如果能把一些多元数据直接显示在平面图上,便可以从图形一目了然地看出多元数据之间的关系。 当只有一、二维数据时,可以使用通常的直角坐标系在平面上点图; 当有三维数据时,也可以使用空间直角坐标系点图,但是已经不方便; 当维数大于3时,用通常的方法已不能点图。 但是在许多实际问题中,多元数据的维数都大于3。 例 考察北京、上海、陕西、甘肃四个省市人均生活消费支出情况,选取以下五项指标,具体数据如下表: 多元数据图表示法的分类: 一类是使高维空间的点与平面上的某种图形应,这种图形能反映高维数据的某些特点或数据间的某些关系; 另一类是在尽可能多地保留原数据信息的原则下进行降维,若能使数据维数降至2或1维,则可在平面上点图。 第二类分类方法可用后面介绍的主成分分析、因子分析等去解决。这一章只对第一类方法介绍四种图表示法,更多的方法可在有关专著中找到。 4.1 轮廓图 作图步骤为: (1)作平面坐标系,横坐标取 个点表示 个变量。 (2)对给定的一次观测值,在 个点上的纵坐标(即高度)和它对应的变量取值成正比。 (3)连接 个高度的顶点得一折线,则一次观测值的轮廓为一条多角折线形。 次观测值可画出 条折线,构成轮廓图。 下图画出四条折线为北京 、 上海、陕西 、甘肃五项指标的数据即四个省市五项指标的轮廓。 轮廓图 由轮廓图可以看出:北京、上海的居民生活消费较高且相似;陕西、甘肃生活消费较低且相似。 如果考察的样品较多,画折线时图形中可能出现重复点多,不便于区分哪个样品对应哪条折线,这时最好多用几种颜色或长短虚实等标志画出折线。 4.2 雷达图 作图步骤: (1)作一圆,并把圆周分为 等分。 (2) 连接圆心和各分点,把这 条半径依次定义为各变量的坐标轴,并标以适当的刻度。 (3) 对给定的一次观测值,把它的 个分量值分别点在相应的坐标轴上,然后连接成一个 边形,这个 边形就是 元观测值的图示, 次观测值可画出 个 边形。 将上例数据用雷达图表示如下: 利用雷达图有助于观测多元数据的某些特点,便于进行分析,例如从上图可以看出北京,上海各项指标都较高,对应着一个面积较大的五边形;而陕西,甘肃各项指标都较低,其图形面积也较小,利用图形和面积大小可对样品进行初始分类,将北京,上海分为一类,陕西,甘肃分为一类。 当观测次数 较大时,为使图形清晰,每张图可以只画少数几次观测数据,甚至每张图只画一次观测值。为了获得较好的效果,在雷达图中适当分配变量的坐标轴,并选取合适的尺度是十分重要的。 注意:这里坐标轴只有正半轴,因而只能表示非负数据,若有负数据,只能通过合理变换使之非负才行。 4.3 调和曲线图 调和曲线图的思想:把高维空间中的一个样品点对应于二维平面上的一条曲线。 调和曲线图是D.F.Andrews在1972年提出的三角多项式作图法,所以又称为三角多项式图。 上例数据北京,上海,陕西,甘肃分别对应的曲线为: 调和曲线图 在多项式的图表示中,当各变量的数值太悬殊时,最好先标准化后再作图。 调和曲线图对聚类分析很有帮助,如果选择聚类统计量为距离的话,同类的曲线非常靠近拧在一起,不同类的曲线拧成不同的束,非常直观。 调和曲线的性质: (1)保线性关系 (2)保欧式距离 4.4 星座图 思想:将高维空间中的样品点投影到平面上的一个半圆内,用投
文档评论(0)