网站大量收购独家精品文档,联系QQ:2885784924

ch04SAS基本统计解析功能.docVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE  PAGE 25 第4章 SAS基本统计分析功能 教学要求: 了解几种假设检验、线性回归、方差分析、拟合优度检验、列联表检验的原理背景 掌握SAS语言进行均值假设检验 掌握SAS语言进行线性回归与方差分析 掌握SAS语言进行拟合优度检验与列联表检验 引言:前面介绍SAS的编程来进行初步的统计分析、报表、绘图。本章我们讲述用SAS进行统计检验、线性回归、方差分析、拟合优度检验和列联表检验。 4.1 假设检验 4.1.1 正态性检验(univariate过程) 1.背景原理:正态分布是一种最常见的分布,也是一种最重要的连续型分布,它以均值为对称轴呈对称的钟型分布。检验的零假设Ho:数据资料服从正态分布。备择假设H1:数据资料不服从正态分布。 当样本量n≤2000时,应选用shapiro-wilk检验法,检验统计量为 W值越接近于1,P值越大,表明资料越服从正态分布,反之W越偏离1,P值越小,表明资料越不服从正态分布。 当n2000时,应用Kolmogorov-smirnov 检验法,检验统计量为 D值越大,P值越小,表明资料越不服从正态分布,反之,D值越小,P值越大,表明资料越服从正态分布。 2.举例 在proc univariate语句中加上normal选项可以进行正态性检验。 【例1】检验数据集sasuser.gpa中变量gpa是否服从正态分布? 输出结果中正态检验部分为: 分析:检验的零假设为Ho:gpa变量服从正态分布,其中shapiro-wilk检验的统计量为w=0.966294,检验的p值小于0.0001,当然小于给定的显著性水平α=0.05,故应拒绝零假设,即有95%把握认为gpa非正态。 说明:使用SAS软件中的“分析家”,打开数据集后,利用菜单“统计”→ “描述性统计”→“分布”,除了可以检验变量是否服从正态分布外,还可以检验对数正态、指数和韦布尔分布。 4.1.2 单样本均值的T检验(univariate过程) 1.原理背景 设总体X~N(μ,σ2),μ、σ2未知,给定检验水平α,对常数μ0要检验 设X1,X2,…Xn为X的简单随机样本,在H0成立时有 其中S为变量的标准差,n为样本量。检验的拒绝域为: 补充P值检验法: t1-α/2(n-1) α/2 t0 p/2 分位数t1-α/2(n-1)满足 Pr{|t| t1-α/2(n-1)}= α 设由已经得到的样本具体计算得到的t值为t0,若|t0| t1-α/2(n-1),则拒绝H0,否则接受H0。对大量重复试验而言,t是随机变量,且服从t分布t (n-1)。当|t0| t1-α/2(n-1)时,有 Pr{|t| t0}Pr{|t| t1-α/2(n-1)}= α 反之亦然。令p= Pr{|t| t0},则|t0|t1-α/2(n-1)等价于pα 所以,假设检验的p值方法为:对给定的显著水平α,当pα时,拒绝H0,当pα时,接受H0 此例介绍的p值检验法对其他统计检验也使用,一般说来,检验的p值是检验统计量取其观测值及更极端值得概率,统计软件对假设检验都会计算检验的p值。 2.应用举例 在SAS中用univariate过程默认进行某个变量均值为零(μ0=0)的t检验,若要检验μ=μ0,则需进行变量代换。 例2:检验数据集sasuser.class中学生的身高均值与63有无显著性差异。 程序: 输出结果为: 分析:先作正态性检验。Ho:变量y服从正态分布,其中shapiro-wilk检验的统计量为w=0.979083,检验的p值=0.9312α=0.05,故应接受零假设,即有95%把握认为变量y正态。 故采用单样本均值T检验。对变量y的零假设为Ho: μ0=0。由输出结果知T检验的统计量t=-0.5638,双边检验的p值为0.5798α=0.05,故接受原假设,即有95%的把握接受学生的平均身高为63。 说明: 当变量服从正态分布时,优先采用t检验,当变量服从非正态时,可以采用符号秩(signed Rank)检验,符号检验(sign)的检验功效较差,一般不常用它。 对同一问题不同的检验方法一般是一致的,但有时也有互相矛盾的结果。 使用SAS软件中的分析家,打开数据集后,利用菜单“统计”→ “假设检验”→“均值的单样本T检验”可以进行双边和单边检验。 4.1.3 两独立样本均值检验(TTest过程、npar1way过程) 1.原理背景 假设两组样本来自两个独立总体,需要检验两个总体的均值或中心位置是否一样。如果两个总体都服从正态分布,则可使用两独立样本均值的T检验。有关公式如下: 设两个样本的均值为,方差为,观测量为。两个样本方差相等与不相等时使用的检验统计量是不一样的,所以应该先对方差的齐性进行检验。 方差齐性检验的

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档