统计学概念和方法-第7章.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 假设检验 数学与信息科学学院 王 坤 TELfellowang@163.com 主要内容 作为一个问题的假设:备择假设、回答假设时的错误 怎样回答零假设所提出的问题:p值 假设检验的机制 拒绝或接受零假设 显著水平 双边检验 假设检验和构造置信区间 不拒绝零假设意味着什么 Excel2007在假设检验方面提供的功能 小结 问题 统计推断包括估计和假设检验。 估计的任务是根据样本寻找总体参数值及其范围。那么,这样估计的把握性有多大呢? 假设检验的兴趣是对任意一个有关未知分布的假设。 假设检验又分为参数检验和非参数检验。参数检验考虑总体参数是否等于某个特定的值。非参数检验是考虑利用子样拟合总体分布。 本章只介绍参数检验。 例 1988年7月28日的纽约时报上刊登了一篇关于人们地理知识的文章。这篇文章描述了一个调查公司的研究结果。研究者们从一些国家抽取许多成年人并请他们鉴别在一个地图上的16个地方,然后把每个人答对的个数加起来。 四个国家的样本中答对的个数的均值为 美国 6.9 墨西哥 8.2 英国 9.0 法国 9.2 上述结果是一个样本均值的情况,可以轻易获得样本均值差。那么,总体均值是否有差异呢? 7.1作为一个问题的假设 在上述问题中,来自墨西哥和美国的总体均值差异是否为零? 零假设 (原假设) 墨西哥与美国的样本均值差为8.2-6.8=1.3,这个值是否超出样本抽样随机性解释范围? 为此, 我们可以假设总体均值相等,即两个总体的均值之差为零。这就是统计学中的零假设(null hypothesis)。 在这个例子里,零假设就是问这两个总体均值之差是否等于零。 记μm为墨西哥的总体均值,μu为美国的总体均值。那么零假设可以写成: H0: μm- μu=0 H代表假设,下标0表明是零假设。“零”的意思是假设内容的差异为零。 注:希腊字母代表总体参数。 零假设就是提出一个参数是否等于某一个特殊值。形式上,零假设写成: H0: 参数=值 备择假设 零假设逻辑上的反面假设是“两个参数的差异不为零”,这种反面假设称为备择假设(alternative hypothesis)。 上述例子中,备择假设为: H1:μm- μu≠0 显然,零假设H0与备择假设H1不相容。如果样本数据能证明零假设提出的问题应该否定,那么我们就拒绝零假设H0 ,而倾向于备择假设H1。 回答假设时的错误 犯两类错误的概率当然是越小越好,但是当样本容量 n 固定时, α , β 不能同时都小,即α 变小时, β 就变大;而 β 变小时,α 就变大。只有当样本容量 n 增大时,才有可能使两者同时变小。 在实际应用中, 人们常遵循 Neyman-Pearson 原则: 在控制犯第一类错误的概率α 的条件下,寻找拒绝域(或检验法则),使得犯第二类错误的概率β 达到最小。 不过,基于 Neyman-Pearson 原则的最优检验不一定存在。 思考 一个人因为杀人而受审理。他实际上是有罪的,但法官确认他为无罪。这里零假设是:一个人是无罪的除非你能证明他有罪。 则此案中,法官犯的是第一类错误还是第二类错误? 法官犯另外一类错误的情形是怎样的? 7.2怎样回答零假设所提出的问题 为了确定1.3这么大的差异是否属于一类不常见的数据集合,我们计算当总体差别为零时,得到一个大于等于1.3的样本均值之差的概率。这个概率称为p值。 当p值很小,以至于几乎不可能在零假设正确时出现目前的样本数据时,我们就拒绝零假设。p值越小,拒绝零假设的理由就越充分。 著名统计学家R.Fisher把0.05作为标准,即0.05或者比0.05小的概率被认为是小概率事件。 p值 p值(p value)就是当原假设H0为真时所得到的样本观察结果或更极端结果出现的概率。如果p值很小,说明这种情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,p值越小,我们拒绝原假设的理由越充分。总之,p值越小,表明结果越显著。 通常,如果p值0.05,说明样本结果是统计显著的,拒绝H0 。如果p值0.05,说明结果更倾向于接受假定H0 。 这里的0.05称为显著水平。 假设检验的机制 为了求得p值,我们需要把观测到的样本均值之差 转换为t=4.25。(这个过程好比把华氏度转换为摄氏度) 这里美国的样本包含了1600个观测,墨西哥的样本有1200个观测。 这个例子里,对于观测数大于2000的样本来说,t值大于等于4.25的概率是0.00001

文档评论(0)

fpiaovxingl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档