第四讲 连续变量参数检验:均值比较检验.pptVIP

第四讲 连续变量参数检验:均值比较检验.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四讲 连续变量的统计推断(一):均值比较的t检验 第一节、假设检验概述 第二节、单样本的T检验 第三节、两独立样本的T检验 第四节、两配对样本的T检验 第一节 假设检验概述 一、推断统计与假设检验 推断统计是根据样本数据推断总体数量特征的统计分析方法。 根据样本来推断总体的原因: 总体数据不可能全部收集到。如:质量检测问题 收集到总体全部数据要耗费大量的人力和财力 推断统计通常包括以下两个内容: 假设总体的分布已知---参数检验 假设总体的分布未知---非参数检验。 参数检验:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立; 非参数检验:是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。 参数检验方法和非参数检验方法比较 非参数检验总是比传统检验安全。 在总体分布形式已知时,非参数检验就不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。 非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。? 二、假设检验的基本思想 1、假设检验采用的逻辑推理方法是反证法 为了检某假设是否成立,先假定它正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设; 2、判断结果合理与否,是基于“小概率事件不易发生”这一原理的 即在一次抽样中,小概率事件不可能发生。如果在原假设下发生了小概率事件,则认为原假设是不合理的;反之,小概率事件没有发生,则认为原假设是合理的。 如:对居民平均取款金额进行推断 H0:总体平均金额2000 样本平均金额为4000,由于存在抽样误差,不能直接拒绝H0。而需要考虑:在H0成立的条件下,一次抽样得到平均金额为4000的可能性有多大。如果可能性较大,是个大概率事件,则认为H0正确。否则,如果可能性较小,是个小概率事件,但确实发生了,则只能认为H0不正确。 三、假设检验的步骤 (1)提出原假设H0。 即根据检验的目标,对待推断的总体参数或分布作一个基本假设 (2)选择检验统计量。 构造检验统计量,且该统计量一定服从某种已知分布. (3)计算检验统计量值发生的概率P值 利用收集到的样本数据和基本假设计算检验统计量的值,并得到相应的相伴概率,即:检验统计量在某个特定的极端区域取值在H0成立时的概率. (4)给定显著性水平α; (5)作出统计决策。 如果相伴概率小于用户给定的显著性水平a,则拒绝H0.否则,不能拒绝H0. 什么是P 值? 是一个概率值; 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率; 被称为观察到的(或实测的)显著性水平。 双侧检验的P 值 左侧检验的P 值 右侧检验的P 值 利用 P 值进行检验 (决策准则) 若p-值 ?,不拒绝 H0 若p-值 ?, 拒绝 H0 四、假设检验的两类错误 假设检验中的两类错误是指在假设检验中,由于样本信息的局限性,势必会产生错误,错误无非只有两种情况,在统计学中,我们一般称为Ⅰ类错误,Ⅱ类错误。 第一类错误(Ⅰ类错误)也称为 α错误:拒真,是指当虚无假设(H0)正确时,而拒绝H0所犯的错误。这意味着研究者的结论并不正确,即观察到了实际上并不存在的处理效应。 第二类错误(Ⅱ类错误)也称为β错误:纳伪,是指虚无假设错误时,反而接受虚无假设的情况,即没有观察到存在的处理效应。 四、均值比较检验的SPSS实现 【比较均值】子菜单 案例:在CCSS项目中,以项目启动时的2007年4月的数据为指数基线,基线期指数值为100,随后各期所计算出的指数则代表当期数值相对于“基线”调查数值的变动比例。CCSS_Sample.sav中提供了北京、上海、广州3个一线城市的调查数据,现有如下目的: 对2007年4月北京、上海、广州3个一线城市的消费者信心指数值的均值进行描述。 对2007年4月3个城市消费者信心指数均值进行分组描述的分析步骤: 第一步:选择待分析的个案 第二步:均值描述过程 点击选项(Options)… 结果解读: 1、数据摘要与基本分组信息 4、选取不同分层变量对结果的影响 (1)分组变量设置为一层,则输出两个独立的表格。 如上图, 将两个分组变量“城市”和“学历”定义在同一层内,即二者是平等的关系,所以会分别按照性别和地区分组输出两张基本信息表。 (2)分组变量设置为两层,则输出一个交叉表格。 如前图,将“城市”作为第一层分组变量,“学历”作为第二层分组变量,二者之间是有层次关系的,所以最后输出的

文档评论(0)

djdjix + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档