贾俊平版统计学课件第9章重点.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
9.3 独立性检验   1.检验列联表中的行变量与列变量之间是否独立   2.检验的步骤   (1)提出原假设和备择假设      :行变量与列变量独立      :行变量与列变量不独立   (2)计算检验统计量 (3)对规定的显著性水平 ,若 则拒绝  .否则不能拒绝 ,即接受  . 独立性检验的出发点 如果变量A和变量B相互独立,那么根据概率论中的独立性规则,P(AB)=P(A)P(B),若P(AB)≠ P(A)P(B),便说明它们并不相互独立。在独立性假设条件下分别计算出A和B个类别发生的理论概率,并估计相应的频数,最后把观察值与期望值相比较,做出决策。 例9.3   一种原料来自三个不同的地区,原料质量划分成三个不同 等级. 从这批原料中随机抽取500件进行检验,结果如表 9-9 所示. 要求检验各个地区和原料之间是否存在依赖关系. 表9-9  原料抽样结果 单位:件 表 9-10      3×3 列联表计算过程 解: :地区和原料之间独立 :地区和原料之间不独立 续 取     时,查表得 由于 所以拒绝  ,接受  . 即认为地区和原料之间不独立. 独立性检验(练习题) 检验服装店顾客的性别和年龄是否是独立的。(? = 0.01) 解: H0 :服装店顾客的性别和年龄是独立的 H1 :服装店顾客的性别和年龄是相关变量 期望频数分布表 所以拒绝H0 ,服装店顾客的性别和年龄是相关变量 拟合优度检验与独立性检验的比较   1.抽取样本的方法不同: 拟合优度检验通常分别各类别各 自抽取一个样本,而独立性检验则只抽取一个样本, 并在抽样后 再分类.   2.原假设不同: 拟合优度检验通常检验一组样本数据是否服从某一分布,或多组样本数据是否服从同一分布(或具有相同分布).而独立性检验则是检验行变量与列变量是否独立.    9.4 列联表中的相关测量 9.4.1 ? 相关系数 9.4.2 列联相关系数 9.4.3 V 相关系数 9.4.4 数值分析 品质相关    两个变量之间相关程度主要用相关系数表示,列联表中的 相关测量,就是利用  值计算相关系数.   列联表中的变量通常为定类变量或定序变量,对于定类变 量或定序变量之间的相关,称为品质相关. 一.? 相关系数 1.2×2 列联表中数据的相关程度 2. 系数的绝对值在 0-1 之间 3. 相关系数为 (9.6) 表9-11 因素 因素 X 合计 Y x1 x2 y1 a b a + b y2 C d c + d 合计 a + c b + d n=a+b+c+d 2 × 2 列联表 ? 相关系数的计算 1.期望频数(估计)为 3. 相关系数为 2. 统计量为 ( 9.7 ) ? 相关系数的特例   1.当 a d = b c ,则           2. b = 0,c = 0 时,或 a=0 ,d = 0   列联表中变量的位置可以互换,从而?的符号没有实际意义,故取绝对值即可. 越大,说明相关程度越高. 时,表明变量之间完全相关. 9.4.2 列联相关系数   1.大于 2×2 列联表中数据的相关程度   2.列联相关系数 ( 9.8 ) 其中   3.C 的取值范围为 0 C 1.   4.C 的大小与列联表的行数与列数有关,C 随行数和列数的增大而增大.   5.不同行数或列数所得的列联系数不宜作比较. 9.4.3 V 相关系数   1. V 相关系数   2.V 的取值范围为 0 ≤ V ≤ 1, V = 0 表明列联表的两个变量独立,V=1 则表明两个变量完全相关.   3.不同行数或列数所得的相关系数不宜作比较.   4.当列联表的行或列数为 2,即 m = min (r,c) = 2,则 ( 9.9) 其中 9.4.4 数值分析   例 9.3 一种原料来自三个不同的地区,原料质量被分成三个不同等级.从这批原料中随机抽取 500 件进行检验,结果如 下. 试分别计算  系数,C 系数和 V 系数,并分析相关程度. 解: 由于三个系数都较小,表明产地和原料等级之间的相关程度不高.  已知 n = 500,R=3,C = 3,已求得 ,得 三个相关系数的说明   1.同一个列联表, 、 C 和 V 的值不同.   2.对不同列联表中变量之间的相关程度进行比较时,行数和列数应相同,并应采用同一种相关系数. 9.5 列联分析中应注意的问题 9.5.1

文档评论(0)

baobei + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档