- 7
- 0
- 约1.01万字
- 约 74页
- 2017-06-02 发布于四川
- 举报
* * * * * * * * * * * * * * * * * * * * * * * * * 两个变量间的关系—矩阵散点图(Matrix Scatter) * 比较多个样本的相似性 —雷达图(radar chart) 也称为蜘蛛图(spider chart) 从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图 可用于研究多个样本在多个变量上的相似程度 当多个变量的取值相差较大或量纲不同时,可进行变换处理后再做图。 线性变换: 对数变换: * 多变量数据—雷达图(例题分析) 【例2-6】2006年我国东部、中部、西部及东北地区城镇居民的生活消费支出数据如表2—8所示。绘制雷达图,比较不同地区的消费支出构成 * 多变量数据—雷达图 (例题分析—原始数据) 四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的 东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大 四个地区各项支出额的结构具有很大的相似性 * 多变量数据—雷达图 (例题分析—标准化变换) 更适宜分析多个样本在多个变量上的差异 东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大 四个地区各项支出额的结构具有很大的相似性 * 20世纪90年代初由Inselberg和Dimsdale提出的展示多元数据的图示方法 将各变量用一系列平行的横坐标轴表示,变量值对应纵轴上的位置 可用于研究多个样本在多个变量上的相似程度或变量间的相互关系 比较多个样本的相似性 —平行坐标图(轮廓图) * 多变量数据—轮廓线图 (例题分析—比较样本:地区) 四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的 东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大 四个地区各项支出额的结构具有很大的相似性 * 多变量数据—轮廓线图 (例题分析—比较变量:各项支出) 四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的 东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大 四个地区各项支出额的结构具有很大的相似性 2.3 合理使用图表 第 2 章 用图表展示数据 * 一张好的图表应包括以下基本特征 显示数据 让读者把注意力集中在图表的内容上,而不是制作图表的程序上 避免歪曲 强调数据之间的比较 服务于一个明确的目的 有对图表的统计描述和文字说明 5种鉴别图表优劣的准则:一张好的图表应当 精心设计、有助于洞察问题的实质 使复杂的观点得到简明、确切、高效的阐述 能在最短的时间内以最少的笔墨给读者提供最大量的信息 是多维的 表述数据的真实情况 鉴别图表优劣的准则 * 本章小结 定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用Excel和SPSS作频数分布表和图形 合理使用图表 结 束 * * * * * * * * * * * * * * * * * * * * * 生成频数分布表(例题分析) 【例2-3】某电脑公司120天的销售额数据(单位:万元) 。生成一张频数分布表观察销售额分布的特征 * 生成频数分布表(例题分析) 确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5?K ?15。本例中由于数据较多,可考虑分为10组 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 例如,本例最大值为237,最小值为141,组距=(237-141)÷10=9.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 统计出各组的频数。每个组的数据满足a?xb(上限值不在内(Excel的计数规则是ax?b) * 分组中的几个概念 1. 下限(lower limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 下限值+上限值 2 组中值 = 制作频数分布 * 生成频数分布表(例题分析) 某电脑公司销售额的频数分布 * 使用Excel频数函数 (FREQUENCY) Excel的【直方
原创力文档

文档评论(0)