1.2独立性检验-的基本思想及其初步应用.docVIP

1.2独立性检验-的基本思想及其初步应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1. 2 独立性检验的基本思想及其初步应用 课前预习学案 预习目标:能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 二、预习内容 1. 给出例3:一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立与之间的回归方程. 温度  21  23  25  27  29  32  35 产卵数个  7  11  21  24  66  115  325 (学生描述步骤,教师演示) 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 课内探究学案 一、学习要求: 通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用 学习重点: 对独立性检验的基本思想的理解. 学习难点: 独立性检验的基本思想的应用. 学习过程: 知识点详解 知识点一:分类变量 对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 知识点二:列联表 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机调查了9965人,得到如下结果(单位:人): 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 像上表这样列出的两个分类变量的频数表,称为列联表. 知识点三:独立性检验 这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 知识点四:判断结论成立的可能性的步骤 一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: 2×2列联表 y1 y2 总计 x1 x b x+b x2 c d c+d 总计 x+c b+d x+b+c+d 若要推断的论述为 H1:“X与Y有关系”, 可以按如下步骤判断结论H1成立的可能性: (1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度. ①在三维柱形图中,主对角线上两个柱形高度的乘积xd与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大. ②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例.两个比例的值相差越大,H1成立的可能性就越大. (2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算由K2=给出的检验随机变量K2的值k,其值越大,说明“X与Y有关系”成立的可能性越大.当得到的观测数据x,b,c,d都不小于5时,可以通过查阅下表来确定断言“X与Y有关系”的可信程度. P(K2≥k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 说明:当观测数据x,b,c,d中有小于5时,需采用很复杂的精确的检验方法. 五、几个典型例题: 例1 三维柱形图中柱的高度表示的是    (A) A.各分类变量的频数   B.分类变量的百分比 C.分类变量的样本数   D.分类变量的具体值 例2 分类变量X和Y的列联表如下 y1 y2 总计 x1 x b x+b x2 c d c+d 总计 x+c b+d x+b+c+d 则下列说法正确的是            (C) X.xd-bc越小,说明X和Y关系越弱    B.xd-bc越大,说明X和Y关系越强 C.(xd-bc)2越大 ,说明X和Y关系越强 D.(xd-bc)2越接近于0 ,说明X和Y关系越强 例3 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的18名,不定的42名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断. 解:根据题目所给数据建立如下列联表 性别 肯定 否定 总计 男生 22 88 110 女生 18 42 60 总计 40 130 170 根据列联表中的数据得到K2=≈2.158<2.706 因此没有充分的证据显示“性别与态度有关”. 例4 打鼾不仅影响别人休息,而且可能与患某种病症有关.下表是一次调

文档评论(0)

huanle + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档