SAS软件应用之定量资料的统计描述PPT.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS软件应用之定量资料的统计描述PPT

统计描述分析 UNIVARIATE过程对数值变量给出比较详细的变量分布的描述,其中包括:变量的极端值、常用的百分位数(包括四分位数和中位数)、用几个散点图描绘变量的分布、频数表和正态分布的检验等。 本章小节 本章介绍了定量资料的统计特征描述,主要包括四个方面:集中趋势、离散趋势、偏度和峰度。本章重点讲解了集中趋势和离散趋势的描述指标。一组数据的集中趋势通常用平均数、中位数和众数等来表示。描述一组计量资料离散趋势的常用指标有极差、四分位数间距、方差、标准差、标准误和变异系数等,其中方差和标准差最常用。本章分别详细介绍了各种统计量的意义以及计算方法。我们应在学习的过程中掌握这些统计量并学会计算。 本章小节 本章重点介绍了正态分布。正态分布在统计学中是最基本、最重要的一种分布,而且它是很多统计理论的基础,在统计学领域有着广泛的应用。本章讲解了正态分布的定义、特征、正态曲线下面积分布、标准正态分布的定义以及意义,最后介绍正态分布的广泛应用价值,尤其是其在制定参考值方面的作用。 本章小节 最后,阐述了SAS系统中进行定量资料的统计描述最常用的两个过程:PROC MEANS过程和PROC UNIVARIATE过程,并以实例演示了如何利用这两个过程进行定量资料的统计描述。这也是我们学习的重中之重。我们需要通过实例掌握这两个过程,并学会灵活运用。 第7章 t检验 学习目标 掌握单样本t检验的基础理论及其SAS分析程序; 掌握配对设计资料t检验的基础理论及其SAS分析程序; 掌握两独立样本t检验的基础理论及其SAS分析程序; 熟悉无原始数据t检验的方法。 概述 简而言之,t检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。 单样本t检验的基础理论 单样本t检验实际上是推断该样本来自的总体均数μ与已知的某一总体均数μ0(常为理论值或标准值) 有无差别。其检验统计量按下式计算 例题 根据大量调查得知,健康成年男子脉搏均数为72次/分,某医生在某山区随机抽查健康成年男子25人,其脉搏均数为74.2次/分,标准差为6.5次/分。根据这个资料能否认为某山区健康成年男子的脉搏数与一般健康成年男子的不同? 例题 在医学领域中有一些公认的生理常数如本例提到的健康成人平均脉搏次数72次/分,一般可看作为总体均数μ。已知在总体均数μ和总体标准差σ已知的情况下可以预测样本均数分布情况,现缺总体标准差,则需用样本标准差来估计它,那么样本均数围绕总体均数散布的情况服从t分布(尤其当样本含量n较小时,)。 下面回答本例提出的问题而进行假设检验。按一般步骤: 例题 提出检验假设H0与备择假设H1: H0:μ=μ0=72次/分,某山区成年男子的脉搏均数与一般成年男子的相等; H1:μ≠μ0=72次/分,即某山区成年男子的脉搏均数与一般成年男子不相等(这是双侧检验,如果事先已肯定山区人的脉搏不可能低于一般人,只检验它是否高于一般人,则应用单侧检验,H1为μμ0)。 定显著性水准α,并查出临界t值。现令α=0.05, 本例自由度ν=n-1=25-1=24、查附表得t0.05,24=2.064。若从观察资料中求出的∣t∣值小于此数,我们就接受H0;若等于或大于此值则在α=0.05水准处拒绝H0而接受H1。 例题 计算检验统计量t: 现已知n=25,=74.2次/分,S=6.5次/分,μ0=72次/分。按公式(7-1) 确定P值,作出推断结论:因∣t∣t0.05,24=2.064,所以检验假设H0得以接受,尚不能得出山区健康成年人的脉搏数不同于一般人而具有显著差别的结论。 第6章 定量资料的统计描述 学习目标 掌握集中趋势和离散趋势描述的常用统计量; 掌握正态分布的特征及其作用意义; 掌握利用PROC MEANS过程进行资料的统计描述; 掌握利用PROC UNIVARIATE过程进行资料的统计描述。 数据的统计特征 在对一组统计数据的分布变化进行深入研究之前,我们首先研究一组数据的特征。为了比较精确地描述一组统计资料的特征,需要使用一些统计指标来描述它。一组数据的统计特征通常包括以下四个方面: 集中趋势 离散趋势 偏度 峰度 集中趋势 集中趋势,也称作中心位置。即表示一组数据的中心位置的数据点是在什么地方,也就是数据集中分布的位置。 一组数据的集中趋势通常用平均数、中位数和众数等来表示。这些统计量均称为平均指标。平均指标的特点是将一组数据中各个数据之间的差异抽象化,用一个指标来代表各个数据的一般水平,它反映了一组数据中各个数据的代表水平、中心位置或集中趋势。 均

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档