- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 两样本的比较
这一章讨论来自不同分布的样本的比较方法,特别是推断分布如何不同的统计方法.样本取自不同条件下的总体,不同条件的可能效应正是所要检验的内容.我们主要关注倾向于增加或降低响应平均水平的效应.
例如,考虑人工降雨问题,我们关注人工降雨是否会增加降雨量?如果能,人工降雨增加降雨量的幅度如何?在人工降雨试验中,选择一些暴雨进行催雨,另一些暴雨不进行催雨,测量每次暴雨的降雨量.这个量会随暴雨的不同而变化很大,即降雨量内在的变异性很大.经过人工催雨的暴雨的平均降雨量可能稍微高于未人工降雨的暴雨的平均降雨量.但稍高的平均降雨量是否就证实了人工降雨有效?由于人工降雨内在的变异性很大,由这种内在的变异性(即随机性)引起稍高的平均降雨量是完全有可能的.换言之,要认定是人工降雨引起的,就需要提出令人信服的理由.我们将介绍解决这类问题的统计方法,利用统计模型将降雨量视作随机变量.我们还会看到随机化过程是如何允许我们进行试验效应的统计推断.
这一章讨论的样本都是连续变量的观测值.而定性数据的统计分析和推断将在后面章节里介绍.
§5.1 两独立样本的比较
在许多试验中,两个样本可以视为是相互独立的.例如,在医学研究中,一部分调查对象被分配给特殊的试验组,另一部分被分配给控制组,当然这种需要随机地进行.然后测量各试验个体的某项医学指标,试验组的结果记为,控制组的结果记为.我们建立如下的统计模型:是样本的实现,且~;是样本的实现,且~;并且两样本相互独立.分析数据意味着对和的比较作推断.在许多试验中,试验的基本效应是改变响应的整体水平,分析集中在和的均值或其他位置参数的差别.
基于正态分布的方法
我们假定是来自总体的简单随机样本,是来自总体的简单随机样本.且两样本独立.比如试验的响应服从正态分布,控制的响应服从正态分布,那么表征试验效应就是两均值之差.因此经常要考虑下面三个检验问题:
(I) 对
(II) 对
(III) 对
在和都已知时,利用前面介绍的寻找检验统计量的基本思想,我们可以想到检验统计量可取为
其中,.又当时,
~
可得假设检验问题(I),(II),(III)的拒绝域依次为;;.
在实际问题中, 和往往是未知的,如果可以认为(比如,可以认为试验的响应和控制的响应各自内在的变异性没有差异),我们可取检验统计量为
其中,
当时,
~
可得假设检验问题(I),(II),(III)的拒绝域依次为;;.
上面的检验,我们使用了假定:两总体具有相同的方差.如果这个假定不成立,在都比较大时,可考检验统计量
在都比较大且时,该统计量近似服从标准正态分布.而一般情况下,它的分布能用分布近似,其自由度为离
最近的整数.
由以上近似的分布可得近似的拒绝域或近似的值.
利用置信区间和假设检验的对偶性,我们也可以通过区间估计对以上假设作检验.
如果总体分布不是正态分布,在样本容量非常大时,根据中心极限定理,使用或正态分布是合理的,假设检验是渐近有效的.然而,当样本容量较小,分布不是正态时,基于正态性假设的结论可能是无效的.遗憾的是,如果样本容量较小,除非偏差相当严重,否则很难有效地检验正态性假设的合理性.
例(P292)
例(P295)
在以上介绍的检验法中要求两总体方差相等,在有一些具体问题中也许有理由承认这个假设.但一般而言,在有了观测数据后我们还是需要对这个假设作检验.另外,在有些统计问题本身也需要对两个总体的方差作比较.比如,要比较两种产品质量的稳定性,比较两种测量方法的精度,比较两款投资品的风险等等. 为此,我们常需要考虑两正态总体之方差的如下检验问题:
(I) 对
(II) 对
(III) 对
在和都未知时,我们可以想到检验统计量可取为
当时,
~
可得关于两总体之方差的假设检验问题(I),(II),(III)的拒绝域依次为或;
;.
非参数方法:Mann-Whitney检验(也叫Wilcoxon秩和检验)
上一节中的检验方法是基于两独立样本都是来自于正态总体.而在不少情形中,这种前提条件并不一定成立.既使能通过正态性检验,在样本容量较小时,其有效性也值得怀疑.于是我们得另辟蹊径,寻找不需要正态性假设的检验方法.当然一点假设都没有是不现实的.这里我们假设:和都是连续型分布,并且和的形式相同只相差一个平移.
在这样的假定(或模型)下,如果,则对于,总有
也即相对于倾向于取更大的值,这种情况我们称之为随机地大于.如果,则随机地小于.如果,则两分布相同.我们考虑如下假设检验问题:
(I) 对
(II) 对
(III) 对
在以上设定的模型下,以上假设分别等价于如下假设
(I) 对
(II) 对
(II
文档评论(0)