第四讲口 假设检验.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四讲 假设检验(Hypothesis Testing) 例子 开发研制的新药对治疗某种特定疾病的效果 水稻亩产量的影响因素分析 心脏病猝死与日期的关系(2.8:1:1:1:1:1:1) 产品自动生产线工作是否正常? 某种新生产方法是否会降低产品成本? 厂商声称产品质量符合标准,是否可信? 案例 澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗? 美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平? 样本推断总体的情况 总体分布已知的情形下,根据样本数据对总体分布的统计参数进行推断(估计或检验) 总体分布未知的情形,根据样本数据对总体的分布形式或特征进行推断 参数假设检验与非参数假设检验 参数假设检验:已知总体分布(给定或假定),猜到总体某个参数的数值(H0),那么这种猜测对不对?需要用一组样本信息来判断。 ,效率高。有一个总体、两个总体和多个总体的参数检验。 非参数假设检验:又称分布检验。在总体分布未知或知之甚少的情况下,用样本数据对总体分布形态等进行推断。猜出总体分布(H0) ,用一组样本来检验该假设是否正确。即假设总体服从 ,用样本信息推断总体是否服从某理论分布。检验条件较宽松,适应性强,但功效较低。(含总体的分布类型检验及独立性检验等) 假设检验内容 4.1 假设检验的基本问题 一、假设检验的基本原理 二、假设检验的基本步骤 三、假设检验的两类错误 四、利用P-Value进行检验 4.2 参数检验 一、总体均值的假设检验 二、总体比例的假设检验 三、总体方差的假设检验 4.3 方差分析 主要应用在在农业、商业、医学、社会学、经济学等诸多领域 一、 方差分析的基本问题 二、 单因素方差分析 三、 多因素方差分析 四、 协方差分析 一、方差分析的基本原理 意义:是英国统计学家费歇(R.A.Fisher)20世纪20年代提出,某变量受多种不同因素不同程度的影响,哪些因素有显著影响,通过方差分析来解决。 核心问题 从数据差异角度看:观测变量的数据差异 =控制因素造成+随机因素造成 影响某农作物亩产量的因素 方差分析正是要分析观测变量的变动是主要由控制因素造成还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的。 一、方差分析的基本原理 基本思路:通过实验或调查,取得不同因素不同水平条件下被考察的随机变量(因变量)的样本;利用样本构造统计量,检验不同条件下的因变即几个不同的总体的均值是否相等,如果均值相等的假设被接受,说明因素及水平对因变量的影响不显著。 方差分析:从观察变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。对观测变量有显著影响的各控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的。 一、方差分析的基本原理 方差分析实际上是通过推断控制变量各水平下观测变量的总体分布是否有显著差异来实现的, 1、假定: 观测变量各总体服从正态分布 观测变量各总体的方差相同 基于上述假定,方差分析对个总体分布是否有显著差异的推断就转化成对各总体均值是否存在显著差异的推断。 因素(Factor):方差分析的对象 因素水平(Factor level):因素的内容 方差分析:针对一定因素(Factor)分析各总体的各个因素水平(Factor level)是否有差异。 单因素方差分析(One-Way analysis of variance):针对一个因素所进行的 双因素方差分析(Two-Way analysis of variance):针对两个因素进行的。 多因数方差分析:涉及两个以上的因数。 2、观测值间差异 观察值之间存在的差异主要来自于: ①组间方差:因素的不同水平造成的,主要是系统性误差,也包括随机因素的影响,用水平间方差来解释。如饮料的不同颜色带来不同的销售量 ②组内方差:抽选样本的随机性而产生,是随机因素的影响,通过水平内方差来显示。如相同颜色饮料在不同商场销售量不同。 总离差平方和=组间离差平方和+组内离差平方和 观测值间差异 总离差平方和=组间离差平方和+组内离差平方和 (即SST=SSA+SSE) 构建统计量:统计学家R.A.Fisher(1890-1962)提出的,叫 分布 若比值近似为1,

文档评论(0)

xiaofei2001128 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档