SAS第9章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS第9章

第九章 单变量检验问题 问题: 男性会计师比女性会计师收入高吗? 戒烟以后人的体重会增加吗? 这些问题都与两组之间的比较有关。 9.1 t检验与非参数检验 1.t分布 t分布的特点 左右对称 受自由度df=n-1的制约,随样本容量n增加,t分布的形状由平坦逐渐变得接近正态分布 当样本容量30时, t分布就非常接近正态分布 适用于用样本方差s2估计总体方差? 2的情况: 总体方差? 2已知; 总体方差? 2未知,但样本容量n30。 当总体方差? 2未知,且样本容量n30 标准误 不再服从正态分布,而服从自由度df=n-1的t分布 具有未知方差的正态分布的均值的100%?(1-?)置信区间为 2.?2分布 特征: 位于区间[0,?) 偏斜度随自由度降低而增大,当自由度df=1时,曲线以纵轴为渐近线 随自由度df增大,分布曲线渐趋左右对称,当df30时, ?2分布已非常接近正态分布 3.F分布 特征: ?F=1,取值区间[0,?) 分布曲线仅取决于df1和df2 4.u检验与t检验 参数方法与非参数方法 参数方法:依赖于某种分布假设的统计方法 非参数方法:不依赖于数据分布类型的统计方法 目的: 进行总体均值与样本均值的比较 或两样本均值的比较 u检验:用于总体?已知,或总体?未知但样本容量n足够大的情况 t检验: 用于总体?未知,且样本容量n较小的情况 要求两样本对应总体?相等,即方差齐性假设 若两样本方差差别较大,需用t?检验 5.非参数检验 ?2检验 符号检验 秩和检验 9.2 单变量的多组比较 1. 独立组与成对组 独立组(Independent groups) 包含对两组独立样本的量测。 分析目的:比较两组的总体均值是否相同。 成对组(Paired groups) 包含多个个体的样本,样本的每个个体包含成对量测。 典型:以前——以后。 分析目的:比判断从“以前”到“以后”的均值的变化是否比纯粹的偶然变化要大。 2.建立两组比较的假设检验 比较独立的两组时 零假设:H0: μA= μB 两组均值相等 备选假设: H1: μA ≠ μB 两组均值不等 其中μA和μB为A、B两组的均值。 比较成对组时 零假设:H0: μD= 0 差值均值为零 备选假设: H1: μD ≠ 0 差值均值不为零 其中μD为A、B两变量差值的均值。 统计检验的方法 结果的解释 两组有显著差异 p值小于临界概率值,则结果为统计显著的,应拒绝零假设。 对独立组,两组的均值显著不同; 对成对组,平均差值显著不为零。 两组无显著差异 p值大于临界概率值,则不能拒绝零假设。 对独立组,两组的均值无显著差异; 对成对组,平均差值与零的差异不显著。 说明:结论不能说明两组均值相等或平均差值为零。 3.两样本t检验 假设有两组样本分别来自两个独立总体,需检验两个总体的均值是否一样。 即零假设是均值相等,对立假设是均值不等。 3.1 检验前提: (1)观测是独立的; (2)样本来自于服从正态分布的总体; (3)两样本的方差相等。 3.2 TTEST过程步 (1)一般形式 PROC TTEST [DATA=数据集名] [选项]; [VAR 变量名列;] [BY 变量名列;] [CLASS 变量名;] RUN; (2)功能 首先检验两组的方差是否相等; 若方差相等,计算t的精确值及其统计的显著程度; 若方差不相等,计算t近似值及其统计的显著程度; (3)说明: TTEST语句: DATA=数据集名:指明分析对象; 常用选项: COCHRAN:在方差不等的情况下要求用Cochran和Cox方法计算近似t统计量的近似概率水平。 VAR语句: 指定要分析(比较其均值)的变量名。缺省值:每个数值型变量。 BY语句: 按指定变量分组统计,要求数据集事先按分组变量排序。缺省值:不分组。 CLASS语句: 指定识别变量(分类变量),用于识别观测所在的组,此变量中只可出现2个不同的值( 2个水平)。 例:检验sashelp.class男女学生的身高均值是否相同。 proc ttest data=sashelp.class; class sex; var height; run; (4)结果说明 简单统计量(Statistics部分) 两样本均值的检验(T-Test部分) 两样本方差是否相等的检验(Equality of Variances部分) (5)计算方法 1)t统计量 设两独立样本分别具有n1和

文档评论(0)

juhui05 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档