- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计实验总结.docx
PAGE10 / NUMPAGES10
数据统计分析一般可遵循以下思路:
(1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:①差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、χ2检验、非参数检验等。②相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。③影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。
(2)明确数据类型,根据数据类型进一步确定方法:①定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。②分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。下图简要列出了不同研究目的、不同数据类型常用的统计分析方法。
(3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。
(4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理的专业结论。
第一部分:统计描述
定量资料的统计描述指标及SAS实现;
(1)数据分布检验:PROC UNIVARIATE
①基本格式:
②语句格式示例:
PROC UNIVARIATE normal;/*normal选项表示进行正态性检验*/
CLASS group;/*指定group为分组变量*/
VAR weight;/*指定分析变量为weight*/
RUN;
③结果:正态性检验(tests for normality)结果,常用的是Shapiro-Wilk
检验和Kolmogorov-Smirnov检验。当例数小于2000时,采用Shapiro-Wilk检验W值为标准;当例数大于2000时,SAS中不显示Shapiro-Wilk检验结果,采用Kolmogorov-Smirnov检验D值为判断标准。正态性检验的P≤0.05提示不服从正态分布,P>0.05提示服从正态分布。
注:若服从正态分布,进行PROC MEANS过程步;若不服从则计算百分位数,
转(3)
(2)数据描述(符合正态分布的数据):PROC MEANS
①基本格式:
关键字(可以无视):不写任何关键字时默认输出n,mean,std,max,min;
n:有效数据记录数(有效样本量) median:中位数
mean:均数 qrange:四分位数间距
std:标准差 var:方差
clm:95%可信区间max、min:最大、最小值
②语句格式示例:
PROC MEANS n mean std median qrangeclm;/*关调用procmeans过程,要求输出的指标有例数、均值、标准差、中位数、四分位数间距、95%可信区间*/
CLASS group;/*指定group为分组变量*/
VAR weight;/*指定分析变量为weight*/
Run;
③结果以“均数±标准差”表示
(3)偏正态分布的统计描述:
①基本思想:计算中位数和百分位数,并且用“中位数(Q1~Q3)”表示
②语句格式示例:
procunivariate data=aa;
var x;
output out=cpctlpre=P pctlpts=0 to 100 by 2.5;/*计算0到100百分位数,间隔2.5个百分位数,并将结果输出在数据集“aa”中*/
run;
proc transpose data=c out=d;
proc print data=d;
run;/*以上是求解百分位数语句*/
procunivariate data=aa
CIPCTLDF(alpha=0.05);/*求百分位数的95%可信区间,(alpha=0.05)此处可缺省;若需求可信区间,只需指定相应的alpha水平*/
var x;
run;
③结果:a.偏态分布的统计描述以“中位数(Q1~Q3)”表示b.总体参数的95%可信区间
分类(定性)资料的统计描述指标及SAS实现
(1)输出频数表:PROC FREQ①基本格式:
②语句格式示例:
PROC FREQ;
TABLE group * weight;/*table后有group和grade两个变量,交叉形成一个行X列的表格,若group为2类,grade为3类,因此形成2X3=6个格子,每一格子中给出例数和相应比例*/
RUN;
(2)直方图的绘制
①基本语句:histogram 变量x
②语句格式示例:
procunivar
您可能关注的文档
最近下载
- 生理学课件:第二章 细胞的基本功能.ppt VIP
- 人教版(2024)新教材小学二年级数学上册第二单元《加、乘减》精品课件.pptx VIP
- 质量突发事件应急预案.docx VIP
- 辅酶q10讲述.ppt VIP
- 多媒体教学在高中数学课堂中的应用研究教学研究课题报告.docx
- 2025生态修复公司管理层与项目轮岗培养考核制度.docx VIP
- 二手车买卖协议电子档 .pdf VIP
- 小型高低温温度冲击试验箱-爱斯佩克.pdf VIP
- 陆上风力发电建设工程质量监督检查大纲、光伏发电建设工程质量监督检查大纲、输变电建设工程质量监督检查大纲.pdf VIP
- 《LY/T 3353-2023湿地生态修复技术规程》.pdf
文档评论(0)