- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章非参数统计引论(非参数统计西南财大)
PAGE
PAGE 33
非参数统计 第一章
非参数统计分析
第一章 引言
§1.1 关于非参数统计
在初等统计学中,最基本的概念是总体,样本,随机变量,分布,估计和假设检验等.其很大一部分内容是和正态理论相关的。在那里,总体的分布形式或分布族往往是给定的或者是假定了的,所不知道的仅仅是一些参数的值或他们的范围。于是,人们的任务就是对一些参数,比如均值和方差(或标准差),进行点估计或区间估计,或者是对某些参数值进行各种检验,比如检验正态分布的均值是否相等或等于零等等.最常见的检验为对正态总体的t—检验,F—检验,和最大似然比检验等.
然而,在实际生活中,那种对总体的分布的假定并不是能随便做出的。有时,数据并不是来自所假定分布的总体;或者,数据根本不是来自一个总体;还有可能,数据因为种种原因被严重污染。这样,在假定总体分布的情况下进行推断的做法就可能产生错误的结论。于是,人们希望在不假定总体分布的情况下,尽量从数据本身来获得所需要的信息。这就是非参数统计的宗旨。因为非参数统计方法不利用关于总体分布的知识,所以,就是在对于总体分布的任何知识都没有的情况下,它也能很容易而又很可靠地获得结论.这时,非参数方法往往优于参数方法。然而,在总体的分布族已知的情况下,不需要任何先验知识就成为它的缺点;因为它没有充分利用已知的关于总体分布的信息,所做出的结论就不如参数方法得到的精确.
在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本的信息就是次序.如果可以把数据点按大小次序排队,每一个具体数目都有它的在整个数据中(从最小的数起)的位置或次序,称为该数据的秩(rank).数据有多少个观察值,就有多少个秩.在一定的假定下,这些秩和它们的统计量的分布是求得出来的,而且和原来的总体分布无关.这样就可以进行所需要的统计推断。
注意,非参数统计的名字中的“非参数(nonparametric)”意味着其方法不涉及描述总体分布的有关参数;它被称为和分布无关(distribution—free),是因为其推断方法和总体分布无关;不应理解为与所有分布(例如有关秩的分布)无关.
§1.2 顺序统计量,秩和线性秩统计量
一、顺序统计量
因为非参数方法通常并不假定总体分布。因此,观测值的顺序及性质则作为研究的对象。
1、顺序统计量:对于样本X1,X2,X3,…,Xn,如果按照升幂排列,得到
称为第个顺序统计量。
2、 基于顺序统计量的统计量
中位数
极差
3、顺序统计量分布函数
设总体的分布函数F(X),则第r个顺序统计量的分布函数为
(4)顺序统计量密度函数
二、秩统计量
1、秩统计量
设X1,X2,X3,…,Xn 来自总体的样本,记为样本点的 秩,即
=
其中
是固定的。它等于小于或等于的的个数。
例如:
原始观测值5.61.42.75.22.64.82.3秩71463522、秩统计量的分布和数字特征
●的联合分布为:
●的概率分布为:
●的数学期望:
●的方差:
3、线性符号秩统计量:设为|X1|,|X2|,|X3|,…,|Xn|中的秩,定义为整数1,2,…,n上的非降函数,满足,则称
如果X1,X2,X3,…,Xn为独立同分布的连续随机变量,并有关于0的对称分布,则
=
4、线性秩统计量:
设X1,X2,X3,…,XN为样本,Ri为Xi在X1,X2,X3,…,XN中的秩。又定义和为定义在1,2,…,N上的函数,则称
为线性秩统计量。称为记分函数。称为回归常数。
定理 记和,则
,。
证 因为
所以
又因为
例 设X1,X2,X3,…,XN为样本,对秩和统计量W=,有,0或1,视或否,有
故
5、正态记分线性秩统计量
令中的,是标准正态分布函数的的反函数。则称为正态记分线性秩统计量。
第二章 单样本非参数检验
在有了一个样本之后,很自然地想要知道它所代表的总体的“中心”在哪里.例如,在对人们的收入进行了抽样之后,就自然要涉及“人均收入”和“中间收入”等概念.这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。例如,在知道总体是正态分布时,要检验其均值是否为;一个传统的基于正态理论的典型方法是t检验.它的检验统计量定义为
这里为样本均值,而为样本标准差。t—检验的统计量在零假设下有n—1个自由度的t—分布。检验统计量是用样本标准差s代替了有标准正态分布的检验统计量的总体标准差后而产生的在大样本时,二者几乎相等。t—检验也许是世界上用得最广泛的检验之一。但是,t—检
文档评论(0)