- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章描述性统计分析表格法
PAGE
PAGE 7
第4章 表格法
在统计分析里,一般用来做统计表的命令有PROC FREQ和PROC TABULATE两种,一般用来做统计图的命令为PROC CHART。
1、PROC FREQ(次数分配表)
FREQ是对类别变量进行归纳的程序。它的一般形式为:
PROC FREQ OPTION1; 必需语句
TABLES 变量/OPTION2;
可选语句
BY 变量;
WEIGHT 变量;
□PROGRAM解释
-proc freq:次数分配表制作过程中的必需语句,如果仅有此语句,则生成输入数据集中每个变量的单向频数表。
□OPTION1
-data=资料名
-order= :界定各类别出现的次序。
order=freq,次序先后依据各类别次数多少而定;
order=data,次序就是它们在输入数据时出现的次序。order=internal,类别先后由英文字母先后决定。
order=formatted,类别次序由外在格式确定。
省略此选项时,内设置为order=internal,另外,缺省值数据总是排在最前面。
-formchar(1 2 7)=‘画表格的符号???,1代表纵轴,2代表横轴,7代表中心点。若无此选项,各位置上的符号系统有内设置。
□TABLES 语句
-tables 变量:指定做频数表的变量。用tables指令时,后边可以是一个变量,也可以是多个变量。根据变量设计一元、二元或多元变量的频数表。
-tables a;做的是变量a为行变量的频数表。
-tables a*b;做的是变量a为行变量,变量b为列变量的频数表。
-tables a*b*c;做的是以变量a分类,变量b为行变量,变量c为列变量的频数表。如果是三元以上的频数表,则倒数第二个变量为行变量,倒数第一个变量为列变量。
- tables a*b a*c;做两个频数表。还可以写成tables a*(b c);
□By 语句
-by 变量:系统依此指令所列举的变量将资料文件分成几个小的资料文件,然后针对每一个小的资料文件分别执行分析。
□Weight 语句
-Weight 变量:代表该变量的值为程序中其他变量的加权值。
2 、Proc tabulate
Tabulate以分组统计表的形式输出满足用户要求的描述性统计量,tabulate程序所能计算的统计值有下面几种:
N:各格内的有效观察体个数 SUM:总和
MEAN:平均数 STD:方差
MIN:最小值 MAX:最大值
PCTN:次数的百分比 PCTSUM:总和的百分比
RANGE:全距,最大值与最小值之间的差值。
这些表格至多可以分为三个向度,即表格的页、行、与列。通常这三个向度由三个变量来定义。通过TABULATE命令能制作出关于这些统计量更美观的统计表格,而且指令的撰写最富弹性,所制作出来的表格易于命名和修饰。一般格式为:
Proc Tabulate option1 ;
Class 变量;
必需语句
Var 变量;
Table 页变量,行变量,列变量/option2;
By 变量;
Freq 变量;
可选语句
Weight 变量;
Format 变量;
Label 变量;
Keylabel 统计值代号=‘代号的解释‘;
□PROGRAME解释
-Proc tabulate:表示开始执行tabulate过程。在这个语句里有option选项。
□option1:
-data=资料名
-missing:要求程序将含有遗漏数据的观察体也包括在表格内。若省略此选项,则所有含有一个(或一个以上)遗漏数据的观察体均将自表格中剔除。
-order= :与 proc freq中的相同。
-formchar(符号的位置) =‘画表格的符号’,这里用1到11个数字代表表格中不同的位置,1代表纵轴,2代表横轴。比如formchar(1 2)=’**’就表示表格的横轴和纵轴都用*表示。
-Class 变量:规定输出统计表中的分组标志,即分类变量,在table语句中将会用到,也就是说在table语句中出现的任意分类变量必须事先在class语句中予以定义。作为分组标志,这些变量一般为离散变量,少数为连续变量,在这种情况下,最好将这些连续变量转变成不连续的变量。
-Var 变量:规定输出统计表中的分析变量。这些变量将会出现在table语句中,也就是说所有在table语句中出现的分析变量必须事先在var语句中予以定义,分析变量必须是数值变量而非文字变量。
-Table 页变量,行变量,列变量/option2:一般来说tabu
文档评论(0)