描述性统计分析.pdfVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

描述性统计分析

本文由应用教程贡献

LOGO

描述性统计分析

统计分析的基本概念

武汉高校计算中

LOGO

进行数据分析首先应:进行数据分析首先应:

明确分析的目的明确分析的对象确定是否须要抽样在一些问题中,要考查整个总体往往是

不行能的,因为要耗费太多的时间和资源确定须要记录的数据项目

武汉高校计算中

LOGO

1.总体和样本

总体(总体(population)是所探讨)的指标测量值的集合.的指标测量值的集合.

抽样(sampling)是指从总体中抽取部分的做法.样本(sample)通过抽样得到的总体的一

个子集.

总体样本

武汉高校计算中

LOGO

抽样方法

简洁随机抽样:在抽样的过程中,简洁随机抽样:在抽样的过程中,任何一个样本被选中的机

会都相同.被选中的机会都相同.利用计算机产生的随机数(对于有限总体),可模拟简洁随

机抽样,如对学生的学号用随机数进行抽样对于无限总体不能进行标号,抽样过程不能用随

机数,难于实施分层抽样:按数据的层次进行抽样.分层抽样:按数据的层次进行抽样.如小

学生的身高,按每年级分为一个层

武汉高校计算中

LOGO

分层抽样的优点

抽取的样本在总体中分布得更匀称,抽取的样本在总体中分布得更匀称,更合理个层内单位

之间差异程度相对减小,个层内单位之间差异程度相对减小,使在该层内抽取的样本对该层

的代表性得到提高层内成员差异小,而层间成员差异较大时,层内成员差异小,而层间成员差

异较大时,分层抽样可以提高估计的精度

武汉高校计算中

LOGO

2.参数和统计量

对总体概括度量值和对样本概括度量值所用的方法及名称是不同的.法及名称是不同的.总

体的度量值称为参数(parameters),样本的总体的度量值称为参数,度量值称为统计量

(statistics).度量值称为统计量.通常,总体参数是未知的总体参数是未知的,SAS系统给

出的描述统通常总体参数是未知的系统给出的描述统计量适用于样本.计量适用于样本.

武汉高校计算中

LOGO

2.参数和统计量

参数():总体的度量值参数(parameters):总体的度量值.):总体的度量值.统计量():样本

的度量值统计量(statistics):样本的度量值.):样本的度量值.一般总体参数用希腊字母

表示:一般总体参数用希腊字母表示:均值方差标准差σσ2总体样本Xs2s

武汉高校计算中

LOGO

3.自由度

自由度是某一统计量中,自由度是某一统计量中,变量可以自由取值的个数表示自由度.用

df表示自由度.表示自由度[例]变量有n个取值,df=n;若它们受到变量X有个取值个取

值,例变量;k(kn)个条件制约,则df=n-k个条件制约,个条件制约

武汉高校计算中

LOGO

4.表示数据位置的统计量

均值(均值(M

ean):):全部观测值的平均值.全部观测值的平均值.

x=(∑xi)/n

i=1

n

中位数():用以描述数据取中位数(Median或Med):用以描述数据取或):值的中心位置.值

的中心位置.中位数的计算方法:先将数据从小到大排序,x1,x2,…,xn然后计算:

中位数的优点是它不受个别极端数据的影响,具有稳健性

武汉高校计算中

LOGO

4.表示数据位置的统计量

众数():观测值中出现最多的数众数(Mode):观测值中出现最多的数.):观测值中出现最多

的数.百分位数(Percentile):描述数据分布和位置的统计百分位数量.0.5分位数就是中

位数,0.75分位数和0.25分位数分别称为上,下四分位数,记为Q3和Q1.一般地,k百分位数

(k-percentile),即约有k%的观测值小于它.

武汉高校计算中

LOGO

5.表示数据分散程度的统计量

极差(Range):数据中最大值和最小值之差.:数据中最大值和最小值之差.极差

极差=max{xi}min{xi}

方差(Variance)以变量取值相对于均方差()值的偏差平方平均来度量(又称均方MS).值

的偏差平方平均来度量(又称均方).

s=(∑(xix))/(n1)

22i=1

武汉高校计算中心

n

LOGO

[例]SAS计算样本方差的步骤例计算样本方差的步骤

计算样

文档评论(0)

152****4379 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档