- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3部分: 单样本 置信区间和 假设检验 第3部分:单样本置信区间和假设检验 目的: 这一部分的目的是介绍连续数据的置信区间和假设检验。 目标: 了解假设检验和置信区间的基本原理-- 确定所观测的差异是真实的,还是偶然因素引起的。 计算样本平均值的置信区间,并将这一平均值与期望(或目标)平均值相比较。 使用单样本置信区间和假设检验,将平均值与目标值相比较。 用图形来表示数据 置信区间 平均值的标准差 有关假设的注解 假设代表了实际问题向统计问题的转换。在这种方法中,以各种术语来表述实际问题,以使其适于科学检验和检测。实质上,假设就是与给定概率分布的参数相关的命题;如平均值和/或方差。换句话说,假设是这样一些命题:使我们能够在进行调查之前提出所有可能的结果。在统计调查之后,我们只需接受或拒绝每个假设,反过来,这些假设又为我们制定现实生活中的实际决策奠定了坚实的基础。 当以零假设表述时,假设通常的含义与偶发事件的分布相关。这种特殊的假设经常被称为“ 零假设”,并以“ Ho”表示。通常,它被称为“名义上的假设。”其意思非常简单--调查的全体参数相等;也就是说,我们所关心的所有参数(平均值和/或偏差)之间没有差异。 直接与零假设相对的是备择假设(Ha)。这类假设一般与非偶发事件的分布相关,因而,被称之为“统计显著地不同”于偶发事件的分布,也就是说,观察到的存在于所调查的样本参数之间的差异不是源于样本的随机偏差。如果观测到的样本的差异不是偶发原因所致,我们可以得出结论,从一个或多个方面来说,样本不同于我们所调查的总体。因此,我们接受不相同的备择假设,并认为样本是从其它总体、而不是从我们所调查的总体中 抽取的。 当接受或拒绝零假设和备择假设时,我们冒已知程度的风险、具有一定的置信度。为此,我们规定(在调查之前)了可接受的决策风险的大小(?、?)和检验灵敏度(?/?)。一旦选择完毕,我们就拥有了所需的信息来确定“合理”的样本大小。用于计算的数学等式确实存在;然而,我们必须将这些计算值与成本、时间和可用资源的实际限制范围相平衡,以便得出“合理的”抽样计划。 单样本CI和假设检验 修订版10 1999年1月11日 GE Appliances Copyright 1999 3.* 举例 洗衣机传动装置的总高度将影响制动性能。项目Y是总高度,目标值=5.394,加工这种部件时所使用的固定架共有8个。 您想了解什么? 使用第三个固定架生产出的部件的平均高度与目标值是否一致? 分析步骤: 1. 将数据绘制成图 2. 使用假设检验和置信区间来确定所观测到的差异是否真实。 3. 得出结论。 设备3 的10 个部件的高度 设备3中10个部件的高度 5.394 5.394 5.393 5.394 5.394 5.395 5.396 5.397 5.395 5.395 5.393 5.394 5.395 5.396 5.397 设备 3 高度 (英寸) 目标值 = 5.394英寸 n =10 x = 5.3947 s = 0.00116 ? 总体平均值的最可能的范围是多少?x(5.3947)与目标值(5.394)之间的差异是由于偶然因素造成的吗? 置信区间 设备3所制造的所有部件的平均值最可能的取值范围是什么? 让我们来计算一下置信区间,以便找出该值! 单个平均值的置信区间 置信区间下限值 1 - a a/2 a/2 x 置信区间上限值 (1-?)100%置信度,真正的总体均值 包含在置信区间内。 什么是t分布? 类似于正态分布(z) 正态分布(z):已知总体标准差,? t分布(t):估计的标准差, s 用于提供有关平均值的结论(置信区间和假设检验) 我们将需要使用t分布 z = (x - ?) ???? n??? t = (x - ?)/(s / n) 3 2 1 0 -1 -2 -3 0.4 0.3 0.2 0.1 0.0 Y z t N - 其中: x = 样本平均值 t = t表格中的t统计结果 a = a风险 df = 自由度 = n -1 s = 样本标准差 n = 样本中的数据点数量 置信区间上限值 = x + t(a/2, df) n s 置信区间下限值 = x - t(a/2, df) n s 用所给出的有关部件的数据代入以上公式… - - 置信区间 计算利用设备3所生产的传输设备平均高度的置信区间 使用?=0.05(95%的置信区间) x = 5
文档评论(0)