【2017年整理】SAS统计图形.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【2017年整理】SAS统计图形

;3.3.1 定量变量的图形表示 3.3.2 分类变量的图形表示;1、直方图(histogram) 2、盒形图 3、散点图(Scatter Plot) 4、线图(Line Plot);直方图是根据变量的取值来显示其频数分布情况的图形。它的横轴代表数据分组,纵轴可用频数或百分比(频率)表示。;对于数值型变量,常用直方图来展示变量取值的分布。将变量取值的范围分成若干区间(一般是等间距的),在等间距区间的情况下,每个区间的长度称为组距。考察数据落入每一个区间的频数或频率,在每一个区间上画矩形,它的宽度是组距,高度可以是频数、频率或密度(频率/组距)。组距对直方图的形态有很大的影响,组距太小,每组的频数较少,由于随机性的影响,邻近区间上的频数可能很大;组距太大,直方图所反映概率密度的形态就会过于粗略。一个合适的分组是希望直方图的形态能接近总体的概率密度,SAS软件会根据样本容量在样本取值范围内自动地确定一个分组方式,另外也提供设定分组的方法。;盒形图是一个用来描述数据分布状况的、类似盒子的图形,有时也叫盒式图、箱线图,是统计分析中一个重要的描述性分析工具。 盒形图可显示数据的5个特征值:最大值、最小值、中位数和两个四分位数。;盒形图由一个盒子和两根线构成。盒子的中间线代表数据的中位数,数据中有一半大于中位数(在其之上),另一半小于中位数(在其之下)。封闭盒子的上下两横线(边)分别为上、下四分位数(点)。因此盒子上下边线内包含了位于分布中间的50%的数据。盒子的长度就是分布的四分位间距。其作用类似于标准差,可以反映数据分布的分散程度。从盒子边线向外画了两条线叫做触须线,最长可以延伸到四分位间距的1.5倍,但是如果已经到了数据的最小值或最大值处就不再延伸。如果有些数据值超出了触须线的范围,则这些数据用触须线以外的点来画出,一般认为这样的店是可能的异常点,在进一步进行数据分析时可以考虑是否需要剔除它。 从盒形图上可以大体看出数据集中在什么范围,上下两侧是否对称。如果盒子的下半部比上半部长,而且下触须线比上触须线长,说明数据分布为左偏;否则数据分布为右偏。;散点图是由坐标轴上的一系列散点构成的图形,通常用来表示两个变量之间的关系。当坐标轴中的散点多的能够连成线的时候,便成为了线图。;线图是由折线和曲线构成的图形。线图在生活中很常见,如股票的K线图、价格走势图等。线图一般由两个变量绘制。;一个变量作为分析变量,即线图中线所代表的含义;另一个变量往往是定性变量或时间变量,作为分类变量或参照变量,用以考察分析变量的变动状况。此外,借助线图也可以同时考察多个变量的变动状况,并从中找出数据之间的关系。;1、条形图(Bar Chart) 2、饼图(Pie Chart) 3、马赛克图(Mosaic Plot);条形图是描述已汇总为频数、相对频数或百分比频数分布的定性数据的图形。;通常将横轴指定为数据的分组标志,而将纵轴指定为频数、相对频数或百分比频数的刻度(横轴和纵轴也可互换);每组标志都用相同宽度的条形表示,条形的长度等于观测数值的大小。在绘图时通常将条形分开以突出每组数据的独立性。;饼图是一种描述定性数据的相对频数和百分比频数分布的图形,通常以圆饼或椭圆饼的形式出现。;饼图的整个圆即代表一个总体的全部数据,圆中的一个扇形表示总体的一个类别,其面积大小由相应部分占总体的比例决定,且各部分比例的总和必为100%。在统计分析中,他主要用来研究结构性问题,如股权结构、投资结构等。;马赛克图一般不针对单个变量,而是针对两个以上分类变量。这种图的好处是直观显示了两个以上变量每种取值组合的观测个数和比例。;3.4.1 用Insight绘制统计图形 3.4.2 用“分析家”绘制统计图形 3.4.3 编程绘制统计图形;1、绘制直方图和条形图 【例3-19】 根据表3-1学生体检数据,以体重为分析变量绘制直方图。 ;;;【例3-20】根据表3-1学生体检数据,以年龄为分析变量生成条形图。 ;;2、绘制盒形图和马赛克图 【例3-21】 以学生体检表中的体重为分析变量,绘制盒形图。;;;;;3、绘制散点图 【例3-22】根据表3-1学生体检数据,绘制身高与年龄的散点图。 ;4、绘制线图 【例3-23】根据表3-1学生体检数据,绘制体重随身高变化的线图。 ;;;1、绘制直方图 【例3-24】根据表3-1学生体检数据,绘制身高分布直方图。;;2、绘制条形图 分析家绘制条形图分为水平条形图和垂直条形图。其操作步骤与绘制直方图相同。 ;3、绘制散点图(线图) 【例3-25】根据表3-1学生体检数据,以身高为横轴、体重为纵轴,分别绘制散点图和线图。 ;;;4、绘制饼图 【例3-26】根据表3-1学生体检数据,按身高分类绘制饼图。 ;;1、GChart过程 2、GPlot过程;计算中心;

文档评论(0)

liangyuehong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档