第四讲 SAS的描述统计 (1).ppt

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.3 编程实现描述性统计计算与绘图 SAS提供多个不同的过程步来实现统计量的计算,它们在功能范围上有许多的重复,本段介绍计算常用统计量的三个过程: 1. MEANS 常用来计算数值型变量的均值、标准差等统计量 2. UNIVARIATE 常用来计算数值型变量的均值、标准差等统计量、 绘制一些统计图 3. FREQ 常用来计算分类变量取值的频数 例2.下表为两个不同地区居民家庭收入和支出情 况的抽样调查(单位:元),试分别统计收入和支出情况。 将下表中数据输入成Excel文件sryzc.xls。4个变量名分别为:ID、R_ID、Income和Outgo,该四个变量分别表示“家庭编号”、“地区编号”、“家庭总收入”和“家庭总支出”。 首先将其导入为SAS数据文件mylib.sryzc。 (3) 使用CLASS语句或BY语句 例3. 1) 使用BY语句, 将上例中的数据按地区(R_Id)分组 计算统计量: 使用BY语句分区域输出统计量: 2) 使用CLASS语句, 按地区(R_Id)分组计算统计量: 使用CLASS语句输出结果: The MEANS Procedure Analysis Variable : INCOME Income R_ID Obs N Mean Median 1st Pctl 5th Ptcl 95th Pctl 1 14 14 2803.71 2775.00 1760.00 1760.00 4275.00 2 16 16 1889.44 1983.00 1080.00 1080.00 2460.00 Lower Upper R_ID Obs 99th Pctl Quartile Quartile Maximum Minimum 1 14 4275.00 2400.00 3305.00 4275.00 1760.00 2 16 2460.00 1740.50 2192.00 2460.00 1080.00 (4)使用Output语句(输出语句) (2)把变量height和weight的均值(新名分别取为hmean和wmean ) 和标准差(新名字分别取为hstd 和wstd )输出到新数据集result3. (3)把变量height的均值、变量height 和weight的标准差(新名字 分别取为hstd 和wstd )和变量weight的方差(新名字取为wvar) 输出到新数据集result4. 2. UNIVARIATE过程(单变量过程) UNIVARIATE过程一般格式: 例5:对数据集bclass中变量HEIGHT和 WEIGHT计算常用描述性统计量 利用Id 语句前、后输出(部分): 不用画图语句时Univariate过程输出一般包括五个部分: 第一部分是矩统计量; 第二部分为基本的位置和分散程度统计量,位置统计量包括均值、中位数、众数,分散程度统计量包括标准差、方差、极差、四分位间距; 第三部分为关于均值等于零的三种检验的结果,包括t检验、符号检验和符号秩检验; 第四部分为各个重要的分位数; 第五部分是观测数据的五个最低值和五个最高值。 Histogram语句(画直方图语句),其一般格式: histogram 变量名 / 选项; 例6 计算家庭总收入的描述统计量,并绘制其直方 图、盒形图及正态概率图。 茎叶图 茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。 茎

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档