网站大量收购独家精品文档,联系QQ:2885784924

社会统计学第10篇 章假设的检定:两个变量的相关.ppt

社会统计学第10篇 章假设的检定:两个变量的相关.ppt

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章;第一节; 倘若要研究X与Y这两个变项是否相关,则在抽取了一个随机样本以后便首先运用前面所介绍的方法,简化样本中的资料,从而计算X与Y的相关程度和方向。但是,即使在样本中X与Y是相关的,却可能是由抽样误差所引起,不一定是在总体中也相关。由于我们所关心的是总体的情况不是样本的情况,因此,需要作统计推论,本章的目的是介绍怎样运用样本的资料来检定假设,在总体中X与Y是相关的。 在介绍计算相关系数时,我们强调要特别注意变项的测量层次,同样,在选用相关的检定法时,也要特别注意该检定法所要求的测量层次。;一、交互分类表中变量的相互独立性 研究定类变量之间的关系,实际上就是通过条件分布的比较进行的,下面我们首先通过条件分布表来看一看两变项的相互独立性。; 根据上表中的每一行,可以比较三代人的喜爱是否有所不同,首先对戏曲来说,三代人的百分比分别是:0.74?0.25?0.04; 歌舞为:0.18?0.50?0.61; 球赛为:0.08?0.25?0.35。 可见,随着代际的年轻化,对戏曲喜爱逐渐下降,而歌舞和球赛越来越受到欢迎,从而得出节目的喜爱与代际相关的结论,也就是变量Y(节目的喜爱)与变量X(代际)是有关的。相关系数计算结果是否如此?;用一个通式来表示 ,即:; 可见,如果交互类表中的变量是相互独立的,边缘分布和条件分布存在以下关系。 ;二、交互分类表的原假设;三、交互分类表检验的统计量X2;求出列联表中各格的期望频次; 于是,在原假设H0成立条件下的期望频次交互分类表有下表1:; 不仿设想,在H0成立的条件下,作无数次抽样,每次抽样可得到一个实例的频次交互分类表,如下表2:; 比较表1和表2,可以想象如果总体中H0为真的话,那么实例频次列联表的格值和期望频次列联表中的格值相差不多的可能性较大。反之,如果两表的格值差距很大。 上述的讨论可用以下的统计量来表示:; 上述统计量,经过数学计算可知,当n很大,每格Eij都不太小,服从自由度K=(r-1)(c-1)的?2分布。 注意,下面就交互分类表的统计量进行讨论: 1.对于2?2表,由于格数过少,为减少偏差,要作连续性修正,尤其在有某一个或多个格的预期次数等于或小于5时必须修正: ; 2.以上?2检验的讨论,也适用于单变量二项总体或多项总体的假设检验。 ; 但是通过列联表的讨论,可引出另一件与?2等价的检验方式:改H0:P=P0(P0为总体成数)。 于是对于样本容量为n的抽样,其理论上期望频次为:E1=np0 而理论上非期望出现的频次为:E2=n(1-p0)。 与此同时,相对应的实际观测值为n1和n2(n1+n2=n)。 引用?2检验有: 可以证明,当n较大时,?2分布近似地为自由度K=1的?2分布,根据连续修正,上述?2为:;(2)多项总体; 3. 使用统计量?2对RC表进行检验,每一格值的Eij要保持在一定数目上。;举例:设实例值和期望值共有7个格值 。; 为什么会出现感觉和X2检验不符的情况呢?主要因为在7个格值中就有3个期望值小于5,占总数的43%。因此?2计算值偏大当出现上述情况时,可将期望值偏小的格值合并。; 例:某镇研究职业代际流动,调查了共140人,其结果如下:; 解:H0:子辈职业与父辈职业无关 H1:子辈职业与父辈职业有关 ;得期望频次表;4.?2检验就其检验的内容来看是双边检验,就检验的形式来看,又象右边检验。; 5. 交互分类的检验是通过频次而不是通过相对频次的比较进行的。;表1的?2值: 表2的?2值 表3的?2值;如果选择a=0.05,查表得: X20.05(1)=3.841=3.84 则表1判断为无显著性差异,表2和表3则判断为有显著性差异,可见,相对频次相同的交互分类表,在统计检验中,其显著性并不相同,特别是当总体中两变量相关并不很大时,如果样本容量较小,很可能呈现无显著性差异,但当样本容量增大时,?2将增大,这时虽然列联表的相对频次没有改变,但很可能呈现有显著性差异,这时因为?2的临界值并不变化。; 通过上面的例子,可以看出,当样本容量增加K倍时,由此可见如果相对频次不变,当样本容量增加K倍时, ?2值将增加K倍。; 例:某工厂为了解职工对厂内福利是否满意,作如下抽样调查:;依H0及样本边缘次数分布,计算期望频数;临界值:由于a=0.05 ,k=(2-1)(2-1)=1;作业;作业 ;3、为研究两种教学方法的效果,选择了6对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实验,结果如下表。问:能否认为

文档评论(0)

youngyu0329 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档