网站大量收购独家精品文档,联系QQ:2885784924

多元数据图表示法.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 多元数据图表示法 3.1 轮廓图 3.2 雷达图 3.3 调和曲线图 3.4 星座图 3.5 脸谱图 本章学习目标 领会作多元数据图的思想。 会作简单的多元数据图形并且会分析图形。 第三章 多元数据图表示法 图形有助于我们对所研究数据的直观了解,如果能把一些多元数据直接显示在平面图上,便可以从图形一目了然地看出多元数据之间的关系。 当只有一、二维数据时,可以使用通常的直角坐标系在平面上点图; 当有三维数据时,也可以使用空间直角坐标系点图,但是已经不方便; 当维数大于3时,用通常的方法已不能点图。 但是在许多实际问题中,多元数据的维数都大于3。 例 考察北京、上海、陕西、甘肃四个省市人均生活消费支出情况,选取以下五项指标,具体数据如下表: 多元数据图表示法的分类: 一类是使高维空间的点与平面上的某种图形应,这种图形能反映高维数据的某些特点或数据间的某些关系; 另一类是在尽可能多地保留原数据信息的原则下进行降维,若能使数据维数降至2或1维,则可在平面上点图。 第二类分类方法可用后面介绍的主成分分析、因子分析等去解决。这一章只对第一类方法介绍四种图表示法,更多的方法可在有关专著中找到。 3.1 轮廓图 作图步骤为: (1)作平面坐标系,横坐标取 个点表示 个变量。 (2)对给定的一次观测值,在 个点上的纵坐标(即高度)和它对应的变量取值成正比。 (3)连接 个高度的顶点得一折线,则一次观测值的轮廓为一条多角折线形。 次观测值可画出 条折线,构成轮廓图。 下图画出四条折线为北京 、 上海、陕西 、甘肃五项指标的数据即四个省市五项指标的轮廓。 轮廓图 由轮廓图可以看出:北京、上海的居民生活消费较高且相似;陕西、甘肃生活消费较低且相似。 如果考察的样品较多,画折线时图形中可能出现重复点多,不便于区分哪个样品对应哪条折线,这时最好多用几种颜色或长短虚实等标志画出折线。 3.2 雷达图 作图步骤: (1)作一圆,并把圆周分为 等分。 (2) 连接圆心和各分点,把这 条半径依次定义为各变量的坐标轴,并标以适当的刻度。 (3) 对给定的一次观测值,把它的 个分量值分别点在相应的坐标轴上,然后连接成一个 边形,这个 边形就是 元观测值的图示, 次观测值可画出 个 边形。 当观测次数 较大时,为使图形清晰,每张图可以只画少数几次观测数据,甚至每张图只画一次观测值。为了获得较好的效果,在雷达图中适当分配变量的坐标轴,并选取合适的尺度是十分重要的。 注意:这里坐标轴只有正半轴,因而只能表示非负数据,若有负数据,只能通过合理变换使之非负才行。 3.3 调和曲线图 调和曲线图的思想:把高维空间中的一个样品点对应于二维平面上的一条曲线。 调和曲线图是D.F.Andrews在1972年提出的三角多项式作图法,所以又称为三角多项式图。 上例数据北京,上海,陕西,甘肃分别对应的曲线为: 调和曲线图 在多项式的图表示中,当各变量的数值太悬殊时,最好先标准化后再作图。 调和曲线图对聚类分析很有帮助,如果选择聚类统计量为距离的话,同类的曲线非常靠近拧在一起,不同类的曲线拧成不同的束,非常直观。 调和曲线的性质: (1)保线性关系   (2)保欧式距离 3.4 星座图 思想:将高维空间中的样品点投影到平面上的一个半圆内,用投影点表示样品点。 作图步骤:   (3)画出一个半径为1的上半圆及半圆底边的直径。   下面对本章开头所给出的数据,使用相同的权数   作星座图。由数据表易知,各指标的最高分,最低分以及它们的级差

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档