- 19
- 0
- 约1.43万字
- 约 46页
- 2019-10-24 发布于湖北
- 举报
2.3 编程实现描述性统计计算与绘图 SAS提供多个不同的过程步来实现统计量的计算,它们在功能范围上有许多的重复,本段介绍计算常用统计量的三个过程: 1. MEANS 常用来计算数值型变量的均值、标准差等统计量 2. UNIVARIATE 常用来计算数值型变量的均值、标准差等统计量、 绘制一些统计图 3. FREQ 常用来计算分类变量取值的频数 例2.下表为两个不同地区居民家庭收入和支出情 况的抽样调查(单位:元),试分别统计收入和支出情况。 将下表中数据输入成Excel文件sryzc.xls。4个变量名分别为:ID、R_ID、Income和Outgo,该四个变量分别表示“家庭编号”、“地区编号”、“家庭总收入”和“家庭总支出”。 首先将其导入为SAS数据文件mylib.sryzc。 (3) 使用CLASS语句或BY语句 例3. 1) 使用BY语句, 将上例中的数据按地区(R_Id)分组 计算统计量: 使用BY语句分区域输出统计量: 2) 使用CLASS语句, 按地区(R_Id)分组计算统计量: 使用CLASS语句输出结果: The MEANS Procedure Analysis Variable : INCOME Income R_ID Obs N Mean Median 1st Pctl 5th Ptcl 95th Pctl 1 14 14 2803.71 2775.00 1760.00 1760.00 4275.00 2 16 16 1889.44 1983.00 1080.00 1080.00 2460.00 Lower Upper R_ID Obs 99th Pctl Quartile Quartile Maximum Minimum 1 14 4275.00 2400.00 3305.00 4275.00 1760.00 2 16 2460.00 1740.50 2192.00 2460.00 1080.00 (4)使用Output语句(输出语句) (2)把变量height和weight的均值(新名分别取为hmean和wmean ) 和标准差(新名字分别取为hstd 和wstd )输出到新数据集result3. (3)把变量height的均值、变量height 和weight的标准差(新名字分别取为hstd 和wstd )和变量weight的方差(新名字取为wvar) 输出到新数据集result4. 2. UNIVARIATE过程(单变量过程) UNIVARIATE过程一般格式: 例5:对数据集bclass中变量HEIGHT和WEIGHT计算常用描述性统计量 利用Id 语句前、后输出(部分): 不用画图语句时Univariate过程输出一般包括五个部分: 第一部分是矩统计量; 第二部分为基本的位置和分散程度统计量,位置统计量包括均值、中位数、众数,分散程度统计量包括标准差、方差、极差、四分位间距; 第三部分为关于均值等于零的三种检验的结果,包括t检验、符号检验和符号秩检验; 第四部分为各个重要的分位数; 第五部分是观测数据的五个最低值和五个最高值。 Histogram语句(画直方图语句),其一般格式: histogram 变量名 / 选项; 例6 计算家庭总收入的描述统计量,并绘制其直方 图、盒形图及正态概率图。 茎叶图 茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。 茎
您可能关注的文档
最近下载
- 高三数学模拟题大题.doc VIP
- 市政工程建设项目质量管理手册(标准版).docx VIP
- 2025反无人机系统架构研究报告.pdf VIP
- 2025年反无人机枪技术发展路线图及产业布局报告.docx VIP
- 五菱宏光保养保修及用户手册.pdf VIP
- 粉面品类新品趋势洞察报告2025.pdf VIP
- 华创交运行业低空60系列深度研究报告:国家安全视角看反无人机系统,急需与刚需,“可选”到“必选”——华创交运低空60系列研究.pdf VIP
- 华创交运低空60系列研究-七-:低空新基建,哪个环节或放量?雷达行业初探.pdf VIP
- 自建房培训课件下载安装.ppt VIP
- 2025年度民主生活会个人对照检查发言材料汇编(五个带头范文八篇).docx VIP
原创力文档

文档评论(0)