- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学习目标 目标解读 1.了解分类变量的意义. 2.了解2×2列联表的意义. 3.了解随机变量K2的意义. 4.通过对典型案例分析,了解独立性检验的基本思想和方法. 1.重点是2×2列联表的意义及随机变量K2的计算与应用. 2.难点是独立性检验的基本思想. * ?问题1:以下两组变量在取不同的值时的区别 (1)体重、身高、学生的学习成绩 (2)性别、国籍、宗教信仰、是否吸烟、是否患病 答:1中每个变量取不同“值”时,表示不同个体, 2中变量每取不同“值”表示个体所属不同的类别 问题2:吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响? 本节课就是要学习独立性检验思想在分析分类变量之间关系中的应用。 1分类变量: 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。 问题引入 为调查吸烟是否对患肺有影响,某种瘤研究所随机地调查了9965人,得到如下结果(单位:人) 表3-7 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 那么吸烟是否对患肺癌有影响? 像表3-7这样列出的两个分类变量的频数表,称为列联表。 结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。 0.0228 0.0054 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 * 等高条形图 不患病 比例 患病 比例 结论:吸烟更容易引发肺癌 * y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 2.列联表 (1)定义:列出的两个分类变量的频数表,称为列联表. (2)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2}, 其样本频数列联表(称为2×2列联表)为: 3. 等高条形图 (1)定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分 别对应不同的颜色,这就是等高条形图. (2)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征. (3)观察等高条形图发现相差很大,就判断两个分类变量之间有关系. * 表1-9 吸烟与肺癌联列表 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 结论是否可靠? 假设H0:吸烟与患肺癌没有关系 用A表示不吸烟,用B表示不患肺癌,则H等价于吸烟与患肺癌独立 P(AB)=P(A)P(B), * 作用:检验两个变量是否有关系 * * 利用随机变量 来判断两个分类变量有关系的方法。 独立检验步骤: (1) 列出2X2列联表 (3)查对临界值,作出判断。 (2)计算 的观测值k; 卡方临界值表: 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 P(K2 ≥k0) k0 如果 , 就以 的把握认为X与Y有系”; 而这种判断有可能出错,出错的概率不超过 。 K2的观测值为k 独立性检验定义: * 对独立性检验思想的理解: 独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大. 判断两个分类变量是否相关的研究方法: (1)感性认识:先通过列联表或等高条形图观察两个量之间是否存在相关关系; (2)理性认识:再假设两个量之间相互独立,然后研究这种假设发生的概率,如果概率很小(小于10%),则说明这种假设不可靠,从而可以得出两个量之间有相关关系! * 例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。 (1)利用图形判断秃顶与患心脏病是否有关系? (2)能否在犯错概率不超0.01的前提下,认为秃顶与患心脏病有关系? P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.
您可能关注的文档
- 杜邦分析法案例分析学习版.ppt
- 演示文档读书主题班会课件.ppt
- 读书节主题班会ppt【通用】.ppt
- 读书活动主题班会课件(方案).ppt
- 读谱与视唱[1]汇总.ppt
- 学习版读后续写 2.ppt
- 斗式提升机培训经典.ppt
- 【通用】动作分析讲义.ppt
- 【爆款】动物营养概述.ppt
- 动物细胞工程经典.ppt
- 2025至2030中国移动治疗台行业发展研究与产业战略规划分析评估报告.docx
- 2025至2030链激酶行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030爆炸物探测扫描仪行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030四川省智能制造行业细分市场及应用领域与趋势展望研究报告.docx
- 2026届高三二轮复习试题政治大单元突破练1生产资料所有制与分配制度含解析.docx
- 2026届高三二轮复习试题政治大单元突破练16哲学基本思想与辩证唯物论含解析.docx
- 2026届高三二轮复习试题政治大单元突破练2社会主义市场经济体制含解析.docx
- 浙江省衢州市五校联盟2025-2026学年高二上学期期中联考技术试题-高中信息技术含解析.docx
- 浙江省金丽衢十二校2026届高三上学期11月联考政治试题含解析.docx
- 2026届高三二轮复习试题政治大单元突破练7领导力量:中国共产党的领导含解析.docx
原创力文档


文档评论(0)