- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计数据的图表示法
* 俞昊东 多元统计数据的图表示法 * 例:从中学某年级随机抽取的12名学生中5门主要课程期末考试成绩。 序号 政治 语文 外语 数学 物理 1 99 94 93 100 100 2 99 88 96 99 97 3 100 98 81 96 100 4 93 88 88 99 96 5 100 91 72 96 78 6 90 78 82 75 97 7 75 73 88 97 89 8 93 84 83 68 88 9 87 73 60 76 84 10 95 82 90 62 39 11 76 72 43 67 78 12 85 75 50 34 37 样本点矩阵 变量 观测次数 1 2 … j … p X1 X11 X12 … X1j … X1p X2 X21 X22 … X2j … X2p … … … … … … … Xi Xi1 Xi2 … Xij … Xip … … … … … … … Xn Xn1 Xn2 … Xnj … Xnp * 多变量数据的维数通常都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪70年代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。 可视化的途径 使高维空间的点与平面上的某种图形对应(每个样本是一个图),这种图形能反映高维数据的某些特点或数据间的某些关系; 降维:在尽可能多地保留原始信息的原则下,将数据的维数降为2维或1维 主要的图表示法 散点图 脸谱图 雷达图 星座图 * 主要的图表示法 轮廓图 雷达图 调和曲线图 散点图 脸谱图 星座图 设变量个数为p,观测次数为n,第k次观测值记为 X(k) =(xk1 xk2 … xkp) (k=1,2,…,n) * 一、散点图 矩阵散点图:是一种反映多个变量之间相关关系的二维散点图 对p个变量两两配对生成一张散点图矩阵 它可以看作是一个大的图形方阵,其每一个非主对角元素的位置上是对应行的变量与对应列的变量的散点图。而主对角元素位置上是各变量名。 散点图矩阵是借助两变量散点图的作图方法, * 表1.1的散点图(五门课程两两配对) * 散点图的优点 直观,简单,容易理解 可清晰地看到变量两两之间的相关关系 散点图的缺点 还不是真正意义上的多变量作图方法 它研究的仍是两两变量之间的相关关系,而不能直接反映多个变量之间的关系 借助它来对资料分类也是比较困难的 * 星座图: 是将高维空间的样本点投影到平面上的一个半圆内,用投影点表示样本点的多元图示方法。每个样本点对应半圆上的一串星星(星座)。 由于样本点在半圆内的投影犹如浩瀚苍穹中的星座,因此而称其为星座图。 * 星座图的构造方法: 每个样本点对应半圆上的一串星星 星星的个数等于变量的个数 将原始数据变为极坐标 由样本数据确定每颗星星相对于前一颗星星的极坐标 以上方法须保证整串星星在一个半圆内 基本画图方法 1.将资料( ) 进行变换,使其取值范围为 。就是构造函数 使得 取 2.对每一变量赋予一个权重 ,满足 ,其中 作图时,权数的取法可以采用随机数法,也可以取 或对比较重要的变量赋予较大的权数。 3.画出一个半径为1的上半圆及底部直径 以圆点 为圆心, 为半径再画一个上半圆,将其弧度为B11的地方记为 ,以 为圆心画上半圆,将其弧度为B12的地方记为 ,以此类推,则 点即为第一个样本点的位置 同理可以画出所得资料所有的点。 由此可以看出,则第k组样本的星座 为: 则 的路径为 4.根据星座图上点的位置及路径判断各样本点之间的接近程度,进而可以对样本点进行归类分析。 实际工作中,往往去掉路径而仅保留其在星座图上的位置并根据各点位置的接近程度分析样本点之间的接近程度。 例:考察北京、上海、陕西、甘肃四个省市人均消费支出情况,选取以下五项指标,具体数据如下表 肉禽及制品 住 房 医疗保健
文档评论(0)