8.3.1 分类变量与列联表课件-高中数学人教A版（2019）选择性必修第三册.pptxVIP

下载本文档

94
0
约1.54千字
约 18页
2021-06-02 发布于中国
举报

8.3.1 分类变量与列联表课件-高中数学人教A版（2019）选择性必修第三册.pptx

8.3列联表与独立性检验;回顾旧知; 前面两节所讨论的变量,如人的身高、树的胸径、树的高度、短跑100m世界纪录和创纪录的时间等,都是数值变量,数值变量的取值为实数.其大小和运算都有实际含义. 在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题.例如,就读不同学校是否对学生的成绩有影响,不同班级学生用于体育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风险,等等,本节将要学习的独立性检验方法为我们提供了解决这类问题的方案。在讨论上述问题时,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等.在很多时候,这些数值只作为编号使用,并没有通常的大小和运算意义,本节我们主要讨论取值于{0,1}的分类变量的关联性问题.;如何利用统计数据判断一对分类变量之间是否具有关联性呢?对于这样的统计问题,有时可以利用普查数据,通过比较相关的比率给出问题的准确回答,但在大多数情况下,需要借助概率的观点和方法,我们先看下面的具体问题。问题1. 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查,全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼。你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?;新课引入;学习新知;在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将下表这种形式的数据统计表称为2×2列联表(contingency table). 2×2列联表给出了成对分类变量数据的交叉分类频数,以右表为例,它包含了X和Y的如下信息: 最后一行的前两个数分别是事件{Y=0}和{Y=1} 中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个格中的数是表格的核心部分,给出了事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数是样本空间中样本点的总数。;例1为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀,试分析两校学生中数学成绩优秀率之间是否存在差异.;?;2.两个分类变量之间关联关系的定性分析的方法：;分数段;问题2.你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的？;1.成语“名师出高徒”可以解释为“知名老师指导出高水平学生的概率较大”,即老师的名声与学生的水平之间有关联,你能举出更多的描述生活中两种属性或现象之间关联的成语吗? 2.例1中的随机抽样数据是否足够确定与X和Y有关的所有概率和条件概率?为什么?;3.根据有关规定,香烟盒上必须印上“吸烟有害健康”的警示语,那么 (1)吸烟是否对每位烟民一定会引发健康问题? (2)有人说吸烟不一定引起健康问题,因此可以吸烟,这种说法对吗?;?;5.下列关于等高堆积条形图的叙述正确的是(　　) A．从等高堆积条形图中可以精确地判断两个分类变量是否有关系 B．从等高堆积条形图中可以看出两个变量频数的相对大小 C．从等高堆积条形图中可以粗略地看出两个分类变量是否有关系 D．以上说法都不对;?;我们将下表这种形式的数据统计表称为2×2列联表(contingency table).

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

8.3.1 分类变量与列联表课件-高中数学人教A版（2019）选择性必修第三册.pptxVIP