第四讲 SAS的描述统计 (1).ppt

下载文档 降价啦

11
0
约1.43万字
约 46页
2019-09-07 发布于湖北
举报
版权申诉
保障服务

第四讲 SAS的描述统计 (1).ppt

1、本文档共46页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

2.3 编程实现描述性统计计算与绘图 SAS提供多个不同的过程步来实现统计量的计算，它们在功能范围上有许多的重复，本段介绍计算常用统计量的三个过程： 1. MEANS 常用来计算数值型变量的均值、标准差等统计量 2. UNIVARIATE 常用来计算数值型变量的均值、标准差等统计量、绘制一些统计图 3. FREQ 常用来计算分类变量取值的频数例2.下表为两个不同地区居民家庭收入和支出情况的抽样调查（单位：元），试分别统计收入和支出情况。将下表中数据输入成Excel文件sryzc.xls。4个变量名分别为：ID、R_ID、Income和Outgo，该四个变量分别表示“家庭编号”、“地区编号”、“家庭总收入”和“家庭总支出”。首先将其导入为SAS数据文件mylib.sryzc。 (3) 使用CLASS语句或BY语句例3. 1) 使用BY语句, 将上例中的数据按地区(R_Id)分组计算统计量：使用BY语句分区域输出统计量： 2) 使用CLASS语句, 按地区(R_Id)分组计算统计量：使用CLASS语句输出结果： The MEANS Procedure Analysis Variable : INCOME Income R_ID Obs N Mean Median 1st Pctl 5th Ptcl 95th Pctl 1 14 14 2803.71 2775.00 1760.00 1760.00 4275.00 2 16 16 1889.44 1983.00 1080.00 1080.00 2460.00 Lower Upper R_ID Obs 99th Pctl Quartile Quartile Maximum Minimum 1 14 4275.00 2400.00 3305.00 4275.00 1760.00 2 16 2460.00 1740.50 2192.00 2460.00 1080.00 (4)使用Output语句(输出语句) (2)把变量height和weight的均值(新名分别取为hmean和wmean ) 和标准差(新名字分别取为hstd 和wstd )输出到新数据集result3. (3)把变量height的均值、变量height 和weight的标准差(新名字分别取为hstd 和wstd )和变量weight的方差(新名字取为wvar) 输出到新数据集result4. 2. UNIVARIATE过程(单变量过程) UNIVARIATE过程一般格式：例5：对数据集bclass中变量HEIGHT和WEIGHT计算常用描述性统计量利用Id 语句前、后输出(部分): 不用画图语句时Univariate过程输出一般包括五个部分：第一部分是矩统计量；第二部分为基本的位置和分散程度统计量，位置统计量包括均值、中位数、众数，分散程度统计量包括标准差、方差、极差、四分位间距；第三部分为关于均值等于零的三种检验的结果，包括t检验、符号检验和符号秩检验；第四部分为各个重要的分位数；第五部分是观测数据的五个最低值和五个最高值。 Histogram语句(画直方图语句)，其一般格式： histogram 变量名 / 选项; 例6 计算家庭总收入的描述统计量，并绘制其直方图、盒形图及正态概率图。茎叶图茎叶图又称“枝叶图”，它的思路是将数组中的数按位数进行比较，将数的大小基本不变或变化不大的位作为一个主干（茎），将变化大的位数作为分枝（叶），列在主干的后面，这样就可以清楚地看到每个主干后面的几个数，每个数具体是多少。茎