第1章非参数统计分析.ppt

下载文档

132
0
约3.17千字
约 61页
2017-04-19 发布于上海
举报
版权申诉
保障服务

第1章非参数统计分析.ppt

1、本文档共61页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第1章非参数统计分析

第二篇非参数统计;参考书《非参数统计》中国统计出版社吴喜之《非参数统计》人民大学出版社王星《非参数统计讲义》北京大学出版社孙山泽 ;非参数统计;第一章非参数统计及一些概念 ; 教学中使用的软件SPSS和R。 SPSS的非参数统计菜单已经比较全面了。;SPSS非参数检验的过程;5. 2 independent Samples Test 两个独立样本检验（检验两个独立总体差异性） 6. K independent Samples Test K个独立样本检验（检验k个独立总体的差异性） 7. 2 related Samples Test 两个相关样本检验（检验两个相关总体差异性） 8 . K related Samples Test K个相关样本检验（检验k个相关总体差异性）; 思考的要点什么是计数统计量；什么是秩统计量，为什么要讨论秩；为什么要讨论秩的分布、秩的期望和方差；什么是符号秩和线性符号秩；线性符号秩???期望和方差。;第一节关于非参数统计; 然而，在实际生活中，那种对总体分布的假定并不是能随便做出的。有时，数据并不是来自所假定分布的总体。或者数据根本不是来自一个总体，数据因为种种原因被严重污染。这样，在假定总体分布的情况下进行推断的做法就可能产生错误的结论。于是，人们希望在不假定总体分布的情况下，尽量从数据本身来获得所需要的信息。这就是非参数统计的宗旨。因为非参数统计方法不利用关于总体分布的相关信息，所以，就是在对于总体分布的任何信息都没有的情况下，它也能很容易而又较为可靠地获得结论。这时非参数方法往往优于参数方法。在台湾这种方法称为“无母数统计”，即不知到总体信息的统计方法。 ; 在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据最基本的信息就是次序。如果可以把数据按大小次序排队，每一个具体数目都有它在整个数据中(从最小的数起)的位置或次序，称为该数据的秩(rank)。数据有多少个观察值，就有多少个秩。在一定的假定下，这些秩和秩的统计量的分布是求得出来的，而且和原来的总体分布无关。这样就可以进行所需要的统计推断。注意：非参数统计的名字中的“非参数(nonparametric)”意味着其方法不涉及描述总体分布的有关数值参数（均值和方差等）；它被称为和分布无关(distribution—free)，是因为其推断方法和总体分布无关；不应理解为与所有分布(例如有关秩的分布)无关。 ; 【例1】　在我国的工业和商业企业中随机抽取22家企业进行资产负债率行业差异分析，其某年底的资产负债率（％）如下：; 将两类企业的资产负债混合排序，并给出其序次，这在统计中称为“秩”。在这张表中我们有两个可用的信息。;　　如果我们将12家工业企业的秩相加是94，其平均秩是7.88，将10家商业企业的秩相加得159，其平均秩为15.9，这就给我们一个可以考虑的信息，两种企业的资产负债是有差异的。他们的平均秩不同。另一个想法是好像工业排的顺序相对靠前，有11111，2，1111，222，111，222222共有6段（相同特点的个案的一段称为游程）。如果原假设成立，则两个行业的负债水平的分布使相同的，将其混合后，应能较为充分、均匀地混合，游程数R应该比较大，反之当游程数R较小，则说明两个总体的分布可能不同。那么6这个游程数是大还是小呢？ ; 【例2】　模拟一个污染的正态分布，计算其样本均值，但是样本均值非正态分布了。这个分布是以0.8的概率是标准正态分布，0.2的概率混进方差为9的正态分布。 workfile a u 1 1000 series junzhi　 for !i=1 to 1000 smpl 1 20 series y1=rnd series y2=nrnd series a smpl if y10.8 a=y2 smpl if y1=0.8 a=9*y2 smpl 1 20 scalar mean=@mean(a) junzhi(!i)=mean next smpl 1 1000 junzhi.hist ;此数据的正态性检验是非正态。;非参数统计归纳起来有如下的三点优点： 1. 对总体的假定少； 2. 可以处