第八章 列联分析七.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
§5.2 分布的期望值准则 此时有两个单元,或分为两个类别:患过肝炎和未患过肝炎。样本量足够大,每个单元的期望频数fe 5,因此可以使用 检验。 2. 若有两个以上的单元,如果20%的单元期望频数fe小于5,则不能应用 检验。 根据准则2,表8-19中的数据可以计算 ,因为6个单元中只有1个单元的期望频数小于5。而表8-20中的数据不能应用 统计量,因为7个单元中有3个单元的期望频数小于5。 * §5.2 χ2分布的期望值准则 表8-19 说明表 表8-20 说明表 * §5.2 χ2分布的期望值准则 表8-20中的fo与fe非常接近,最大的差别只是3,应当说期望值与观察值拟合得很好,它们之间并无显著区别。 然而用 =0.05的 进行检验,则会得到: 结果拒绝原假设H0,结论是期望值与观察值之间存在显著差异。 * §5.2 χ2分布的期望值准则 如果将这个例子中的某些类别合并,使得fe≥5,差异就消除。 例如,将表8-20中的类别E、F、G合并,合并后 f =5+5+4=14, fe=2+4+1=7 此时虽然fo与fe之间的差别扩大到7,合并以后有: 结果是接受H0,期望值与观察值之间不存在显著差异。 * 谢 谢 ! §3 独立性检验 独立性检验(Test of Independence) 在研究问题时有时会遇到要求判断两个定类变量之间是否存在联系的问题。在这种情况下可以使用 检验,判断两组或多组的资料是否相互关联。如果不相互关联,就称为独立。把这类问题的处理称为独立性检验(Test of Independence)。 * §3 独立性检验 【例8.3】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如表8-9所示 表8-9 原料抽样的结果 要求检验各个地区和原料质量之间是否存在依赖关系? * §3 独立性检验 解: :地区和原料等级之间是独立的(不存在依赖关系)。 :地区和原料等级之间不独立 (存在依赖关系)。 在第一行,甲地区的合计为140,用140╱500作为甲地区原料比例的估计值。在第一列,一级原料的合计为162,用162╱500作为一级原料比例的估计值。如果地区和原料等级之间是独立的,可以用下式估计第一个单元(甲地区,一级)中的期望比例。 * §3 独立性检验 令: A = 样本单位来自甲地区的事件 B = 样本单位属于一级原料的事件 根据独立性的概率乘法公式有: P(第一单元) =P(A·B) =P(A)·P(B) =0.09072 * §3 独立性检验 计算任何一个单元中频数的期望值公式 fe :给定单元中的频数期望值 RT:给定单元所在行的合计 CT:给定单元所在列的合计 n:观察值的总个数,即样本容量。 * §3 独立性检验 表8-10 3×3列联表期望值计算过程 * §3 独立性检验 的自由度为(R-1)*(C-1)=4 取 =0.05,查表知: 0.05(4)=9.488 0.05(4),故拒绝H0,接受H1 ,即地区和原料等级之间存在依赖关系,原料的质量受地区的影响。 * §4列联表中的相关测量 §4.1 φ相关系数 §4.2 列联相关系数 * §4.1 φ相关系数 系数 系数是描述2*2列联表数据相关程度最常用的一种相关系数。它的计算公式为: 式中, n为列联表中的总频数,即样本量。 * §4.1 φ相关系数 表8-11 2*2列联表 * 注:a,b,c,d均为条件频数。 §4.1 φ相关系数 表8-11中,当变量X,Y 相互独立,不存在相关关系时,频数间应有下面的关系 化简后有:ad=bc。 结论 差值ad-bc的大小可以反映变量之间相关程度的强弱。若差值越大,说明两个变量的关联程度越高。 * §4.1 φ相关系数 在2*2列联表中,每个单元中频数的期望值为: * §4.1 φ相关系数 * §4.1 φ相关系数 当ad=bc时,表明变量X,Y之间相互独立, 若b=0, c=0时,X与Y完

文档评论(0)

好文精选 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档