假设检定两个变量相关.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
假设检定两个变量相关

第十章 假设的检定—— 两个变量的相关 第一节 两个定类变项 倘若要研究X与Y这两个变项是否相关,则在抽取了一个随机样本以后便首先运用前面所介绍的方法,简化样本中的资料,从而计算X与Y的相关程度和方向。但是,即使在样本中X与Y是相关的,却可能是由抽样误差所引起,不一定是在总体中也相关。由于我们所关心的是总体的情况不是样本的情况,因此,需要作统计推论,本章的目的是介绍怎样运用样本的资料来检定假设,在总体中X与Y是相关的。 在介绍计算相关系数时,我们强调要特别注意变项的测量层次,同样,在选用相关的检定法时,也要特别注意该检定法所要求的测量层次。 一、交互分类表中变量的相互独立性 研究定类变量之间的关系,实际上就是通过条件分布的比较进行的,下面我们首先通过条件分布表来看一看两变项的相互独立性。 根据上表中的每一行,可以比较三代人的喜爱是否有所不同,首先对戏曲来说,三代人的百分比分别是:0.74?0.25?0.04; 歌舞为:0.18?0.50?0.61; 球赛为:0.08?0.25?0.35。 可见,随着代际的年轻化,对戏曲喜爱逐渐下降,而歌舞和球赛越来越受到欢迎,从而得出节目的喜爱与代际相关的结论,也就是变量Y(节目的喜爱)与变量X(代际)是有关的。相关系数计算结果是否如此? 现在设想,如果统计的结果显示,三代人的百分比是不变的,即: 戏曲:0.74、0.74、0.74 歌舞:0.18、0.18、0.18 球赛:0.08、0.08、0.08 那么,又该作出什么结论呢? 即: 可见,如果交互类表中的变量是相互独立的,边缘分布和条件分布存在以下关系。 二、交互分类表的原假设 交互分类表检验是将总体中变量间无关系,或相互独立作为检验的原假设。即: H0:变量x与变量y无关(总体) H1:变量x与变量y有关(总体) H0:pij =pi*.p*j (i=1,2??c;j=1,2??r) 由于pi和pj是总体的边缘分布,一般都是未知的,因此,可以用样本中的边缘频率分布作为它的点估计值: 列边缘: i=1,2??c 行边缘: j=1,2??c 这里小写字母ni,nj,n表示样本频次。 三、交互分类表检验的统计量X2 运用统计量?2来进行检验。?2检验要求:1)样本是用随机方法抽取的;2)两个变量都是有定类的性质。 交互分类检验的程序和单变量检验是相同的:确定原假设;选择适当的统计量,定出显著性水平后根据样本值进行判断。 交互分类表统计量的确定是通过在原假设成立的条件下,用总体和样本一系列值的比较来进行的,具体步骤是: 求出列联表中各格的期望频次 于是,在原假设H0成立条件下的期望频次交互分类表有下表1: 不仿设想,在H0成立的条件下,作无数次抽样,每次抽样可得到一个实例的频次交互分类表,如下表2: 比较表1和表2,可以想象如果总体中H0为真的话,那么实例频次列联表的格值和期望频次列联表中的格值相差不多的可能性较大。反之,如果两表的格值差距很大。 上述的讨论可用以下的统计量来表示: 上述统计量,经过数学计算可知,当n很大,每格Eij都不太小,服从自由度K=(r-1)(c-1)的?2分布。 注意,下面就交互分类表的统计量进行讨论: 1.对于2?2表,由于格数过少,为减少偏差,要作连续性修正,尤其在有某一个或多个格的预期次数等于或小于5时必须修正: 2.以上?2检验的讨论,也适用于单变量二项总体或多项总体的假设检验。 (1)二项总体。 在单总体假设检验中,曾谈到对于大样本总体成数的假设检验,可用: Z= 作为总体成数的原假设 H0:P=P0的统计量。 但是通过列联表的讨论,可引出另一件与?2等价的检验方式:改H0:P=P0(P0为总体成数)。 于是对于样本容量为n的抽样,其理论上期望频次为:E1=np0 而理论上非期望出现的频次为:E2=n(1-p0)。 与此同时,相对应的实际观测值为n1和n2(n1+n2=n)。 引用?2检验有: 可以证明,当n较大时,?2分布近似地为自由度K=1的?2分布,根据连续修正,上述?2为: (2)多项总体 多项分布是单项二项分布的自然扩展,如果变量A共有R类:A1、A2、??Ar。 设总体种各类的概率为:P1、P2、??Pr。于是总体的原假设H0为:H

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档