高中数学课件:8-3-1分类变量与列联表.pptx

高中数学课件:8-3-1分类变量与列联表.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数学第八章成对数据的统计分析§8.3.1分类变量与列联表

新课程标准解读核心素养1.通过实例,理解2×2列联表的统计意义.2.理解判断一对分类变量之间是否具有关联性的方法.通过学习2×2列联表,提升学生的数学抽象、直观想象及数据分析素养.学习目标

世界无烟日(WorldNoTobaccoDay),是世界卫生组织在1987年创立的,第一个世界无烟日是1988年4月7日,自1989年起,世界无烟日改为每年的5月31日。为什么将世界无烟日改为5月31日呢?是因为第二天是国际儿童节,希望下一代免受烟草危害。世界无烟日的意义是宣扬不吸烟的观念。而每年皆会有一个中心主题。2024年是第37个世界无烟日。2019年世界无烟日的重点是“烟草和肺部健康”吸烟是否会增加患肺癌的风险?怎样用数学知识说明呢?创设情境

1、分类变量:一种特殊的随机变量,以区别不同的现象或性质例如:对于性别变量,其取值为男和女两种.♂♀这种变量的不同“值”表示个体所属的不同类别.性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等都属于分类变量体重、身高、温度、考试成绩等等这些变量属于数值变量变量数值变量分类变量分类变量与数值变量之间的区别是什么?新知探究

变量数值变量分类变量分类变量与数值变量之间的区别是什么?例:体重、身高、温度、考试成绩等数值变量的取值为实数.其大小和运算都有实际含义.两个数值变量之间的关系:回归分析法;由一个变量的变化去推测另一个变量的变化例:性别、是否吸烟、是否患肺癌、国籍等分类变量的取值可以用实数来表示;这些数值只作为编号使用,用来表示不同的类别;并没有通常的大小和运算意义。例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示本节我们主要讨论取值是{0,1}的分类变量的关联性问题.新知探究

2、2×2列联表以左表为例,2×2列联包含了X和Y的如下信息:最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个格中的数是表格的核心部分,给出了事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数是样本空间中样本点的总数.如上表这样,列出两个分类变量的频数表,称为列联表。特别地,两个变量都只有两个结果,这样的列联表叫【2×2列联表】XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d新知探究

问题情境为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,其中,不吸烟的7817人中42人患肺癌,吸烟的2148人中91人患肺癌,试分析吸烟是否对患肺癌有影响.不患肺癌(Y=0)患肺癌(Y=1)总计不吸烟(X=0)吸烟(X=1)总计解:定义分类变量X和Y如下:关于分类变量X和Y的2×2列联表如下:如何判断两个分类变量之间是否具有关联性呢?777520999874424991781721489965

不患肺癌(Y=0)患肺癌(Y=1)总计不吸烟(X=0)7775427817吸烟(X=1)2099492148总计9874919965??在不吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是?两个分类变量之间关联关系的定性分析的方法方法1——由频率估计概率XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d通过对样本的每个分类变量的不同类别事件发生的频率大小进行比较来分析分类变量之间是否有关联关系.一般其值相差越大,分类变量有关系的可能性越大。

不患肺癌(Y=0)患肺癌(Y=1)总计不吸烟(X=0)7775427817吸烟(X=1)2099492148总计9874919965两个分类变量之间关联关系的定性分析的方法XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d一般其值相差越大,分类变量有关系的可能性越大。方法2——借助条件概率??

两个分类变量之间关联关系的定性分析的方法能够直观地反映出两个分类变量间是否相互影响。方法3——借助等高堆积条形图说明吸烟者中患肺癌的概率更高。在吸烟者中患肺癌的比重是2.28%.在不吸烟者中患肺癌的比重是0.54%.

微判断×√√

微训练B

微训练26100

微训练

题型一用2×2列联表分析两个分类变量间的关系经典例题

题型一用2×2列联表分析两个分类变量间的关系经典例题

题型一用2×2列联表分析两个分类变量间的关系经典例题(1)作2×2列联表时,关键是对涉及的变量分清类别.(2)利用2×2列联

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档