成都理工大学商学院统计学课件第3章 定量数据的描述方法.pptVIP

成都理工大学商学院统计学课件第3章 定量数据的描述方法.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
确定组距 组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 组距=[21.06-(-17.75)]÷6=6.47 为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 。 统计出各组的频数 每个组的数据满足a?xb(上限值不在内 注意:上限不计入原则 (Excel的计数规则是ax?b) 等距分组表(闭口分组) 等距分组表(开口分组) 3.1.2 分组数据看分布--直方图 用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 本质上是用矩形的面积来表示频数分布 3.1.2分组数据看分布—直方图 (直方图与条形图的区别) 条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列 条形图主要用于展示定性数据,而直方图则主要用于展示定量数据 未分组数据看分布—茎叶图 (stem-and-leaf plot) 用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 在茎叶图中,每一个数值被分成两部分,打头的数字作为茎,尾随的数字作为叶。茎沿竖直轴线放置,叶沿水平轴线堆放。它像一片带有长短不一的叶子的茎。 茎叶图类似于横置的直方图,但又有区别 直方图可观察一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 直方图适用于大批量数据,茎叶图适用于小批量数据 用SPSS绘制茎叶图和箱线图 (包括直方图) 第1步:选择【Analyze】菜单,并选择 【Descriptive statistics-Explore】 选项进入主对话框 第2步:在主对话框中将变量选入【Variables】, 点击【Plots】,在对话框中选择【Stem- and-leaf】(根据需要可选【Histogram】以给出直方图)。点击Continue】回到主对话 框。点击【OK】 未分组数据看分布—茎叶图 (例题分析) 第一列给出每个茎上叶子的频数 第二列是“茎”,第三列是“叶” 茎的宽度10、每个叶代表一个数据(案例) SPSS自动将每个茎重复了一次,使分布的细节看的更清楚一些。当然,在数据较少时茎的数值也可以不重复 在SPSS中选择Graphs-line,再选择Simple,在Data in Chart Are中选择Values of individual cases,然后在主对话框左边列表中把sales放到Line Represent框中,分类标签选为年月,单击OK;在SPSS中选择Analyze-Time Series-Seasonal Decomposition,在Variable(s)(变量)处选择sales。单击OK;或者在Excel中使用“插入图表”工具按钮,选择线图 时间序列数据—线图 (实例) 时间序列数据 (由 Excel 绘制的线图) 3.2.2未分组数据看分布—箱线图 (box plot) 用于显示未分组的原始数据的分布 箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)这5个值绘制而成的 中位数是一组数据排序后处于中间位置上的变量值 四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值 绘制方法 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分位数画出箱子,再将两个极值点与箱子相连接 箱线图上下的两条线的长度则可以有不同的选择。 如果没有数据值大于QU+1.5*IQR,那么该线以数据最大值为端点, 否则,线的上端点为上四分位数加上1.5倍的箱子长度,比该端点大的数值则分别在其上方按照其实际值点出。 如果数据处于QU+1.5*IQR至QU+3*IQR的范围内用圆圈标出,超出了QU+3*IQR的用星号标出。 下面的线也类似。由QL至QL-1.5*IQR区间内的最小值向箱子的底部连线;QL-1.5*IQR至QL-3*IQR的范围内用圆圈标出,小于QL-3*IQR的用星号标出。 分布的形状与箱线图 未分组数据看分布—多批数据箱线图 (例题分析) 用SPSS绘制多批数据箱线图 第1步:选择【Graphs】下拉菜单,并选择【Boxplot】 第2步:在出现的

您可能关注的文档

文档评论(0)

ormition + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档