实用SAS统计分析教程Ch06.pdf

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

阮敬博⼠

⾸都经济贸易⼤学研究⽣院副院⻓

⾸都经济贸易⼤学统计学院教授

©ruanjing@

统计量与统计表

•我们每天都⽣活在数字的海洋当中,薪⽔、奖⾦、股票指数、基⾦净值、银

⾏利率、汇率、CPI(消费价格指数)、中奖号码……,这些数字使⼈眼花

缭乱;也⽣活在数据的周围,教育程度、职称、产品等级、政治观点……,

这些⾮数字的数据也会给⼈们的⽣活带来巨⼤的影响。⾯对这些复杂并且交

织的数据,没有⼈能够记住它的全部信息,但是⼈们能够通过⼀定的⼿段缕

清数据,把看似错综芜杂的数据还原或描述出其本来⾯貌,并对⼤量数据

进⾏概括和描述性的分析,使得⼈们可以快速理解并把数据应⽤到实际⼯作。

•本章主要讲述对各类常⻅数据如何利⽤SAS系统,⽤常⻅的统计表格和⼀

些简单的指标来进⾏描述数据,把数据的特征及其内在结构直观明了的呈现

出来。

统计量

•对于数据的描述,可以使⽤⼀些汇总的数据信息来进⾏抽象和概括。这些抽象和

概括的数据是通过我们收集⽽得的原始数据进⾏归纳总结的,能够⽤⼀两个较少的

变量来代表全体数据的信息。同时这些概括性的变量⼜是能够从收集的样本数据中

直接计算出来的,能够在⼀定的程度上反映总体的特征,因此,把其称之为样本统

计量,简称统计量。

•统计量是从样本数据中计算出来的,同⼀总体可以⽤不同的⽅式得到不同的样本数

据。因此,根据不同的样本计算的统计量的值就有可能不同,所以统计量具有不确

定性,同时也是不唯⼀的,但是是已知的。

•样本数据的统计量可以从集中趋势、离散程度和分布形状等⼏个⽅⾯进⾏测量。

集中趋势

•集中趋势⽤于描述⼀组数据的集中位置或平均⽔平,它代表了⼀组数

据典型⽔平,反映了⼀组数据中⼼点的位置。具体有以下⼏种:

✓均值(Mean)

✓中位数(Mediam)

✓分位数(Quantile)

✓众数(Mode)

均值(Mean)

均值(Mean)

•例:10名学⽣统计学期末考试成绩如下,计算其平均分,如下表所示。

学号12345678910

成绩89907898877669909288

•经过计算,这10名学⽣统计学期末考试的平均成绩为857/10=85.7(分)。

•均值在统计学中具有极其重要的地位,它⼀般⽤于寻找数值型数据的中⼼值,⽽不适⽤于分类数据

和顺序数据集中趋势的测度。此外均值很容易受到极端值的影响。

•利⽤MEAN函数可以实现均值的计算,具体程序如下:

data;

x=mean(89,90,78,98,87,76,69,90,92,88);/*调⽤MEAN函数计算均值*/

put均值=x;/*在OUTPUT窗⼝中输出均值计算结果*/

run;

•SAS系统还提供截尾均值以及缩尾均值的计算。

均值(Mean)

•截尾均值(TrimmedMean)

计算原始数据中去掉最⼤N个和最⼩N个(或百分之N个)值后的平均值。其中的N可以指定为

1,2,3,这是变量中⼼位置的⼀种稳健(鲁棒性)估计,但估计量本身不再服从正态分布。

这种均值的计算⽅法在现实⽣活也⾮常实⽤,去掉头尾若⼲个最⼤最⼩的数据,有利于克服极端值对

数据分析的影响。如电视歌⼿⼤赛中,经常会看⻅在对歌⼿进⾏打分的时候,听到主持⼈唱分的时候

去掉⼀个最⾼分,去掉⼀个最低分的说法,此处的⼀个最⾼分和⼀个最低分,实质上是在SAS系统

中当N=1时的截尾均值。

文档评论(0)

医药前沿 + 关注
实名认证
内容提供者

专业医药相关文档服务

1亿VIP精品文档

相关文档