- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2018版高中数学北师大版选修2-3学案:第三章疑难规律方法:第三章统计案例
1 回归分析与独立性检验的理解与加深一、回归分析1.线性回归方程y=bx+a,其中:b==,a=-b.(注:b=主要方便计算,其中(xi,yi)为样本数据,(,)为样本点的中心)公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋势.2.样本相关系数的具体计算公式:r==公式作用:反映两个变量之间线性相关关系的强弱.当r的绝对值接近1时,表明两个变量的线性相关性越强;当r的绝对值接近0时,表明两个变量之间几乎不存在线性相关关系.公式联系:(1)由于分子与回归方程中的斜率b的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当r0时,两个变量正相关;当r0时,两个变量负相关.(2)常配合散点图判断两个随机变量是否线性相关.散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失效;它形象直观地反映了数据点的分布情况.相关系数r是从数上反映了两个随机变量是否具有线性相关关系,以及线性相关关系的强弱,它较精确地反映了数据点的分布情况,准确可靠.二、独立性检验(一)基础概念的梳理与理解1.分类变量:对于宗教信仰来说,其取值为信宗教信仰与不信宗教信仰两种.像这样的变量的不同“值”表示个体所属的不同类别的变量称为分类变量.例如性别变量其取值为男和女两种,吸烟变量其取值为吸烟与不吸烟两种.2.两个分类变量:是否吸烟与是否患肺癌,性别男和女与是否喜欢数学课程等等,这些关系是我们所关心的.3.2×2列联表:列出的两个分类变量A和B,它们的取值分别为{A1,A2}和{B1,B2}的样本频数表称为2×2列联表(如表1).表1B1B2总计A1aba+bA2cdc+d总计a+cb+da+b+c+d(二)独立性检验的基本思想从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法.1.基本思想与图形的联系假设两类分类变量是无关的,可知如下的比应差不多,即:≈?|ad-bc|=0.构造随机变量χ2=(其中n=a+b+c+d)(此公式如何记忆,其特点是什么?结合2×2列联表理解)显然所构造的随机变量与|ad-bc|的大小具有一致性.2.独立性检验的思想方法如果χ2的值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就是两分类变量是有关系的(称小概率事件发生);如果χ2的值较小,此时接受假设,说明两分类变量是无关系的.其思想方法类似于数学上的反证法.3.得到χ2的值常与以下几个临界值加以比较:如果χ22.706,就有90%的把握认为两分类变量A和B有关系;如果χ23.841,就有95%的把握认为两分类变量A和B有关系;如果χ26.635,就有99%的把握认为两分类变量A和B有关系;如果χ2≤2.706,就认为没有充分的证据说明变量A和B有关系.像这种利用随机变量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.2 回归分析题目击破一、基本概念函数关系是一种确定关系,而相关关系是一种非确定关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.例1 下列变量之间的关系是相关关系的是________.(1)正方形的边长与面积之间的关系;(2)水稻产量与施肥量之间的关系;(3)人的身高与年龄之间的关系;(4)降雪量与交通事故发生率之间的关系.分析 两变量之间的关系有两种:函数关系和带有随机性的相关关系.解析 (1)是函数关系;(2)不是严格的函数关系,但是具有相关性,因而是相关关系;(3)既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;(4)降雪量与交通事故发生率之间具有相关关系.答案 (2)(4)点评 该例主要考查对变量相关关系概念的掌握.二、线性回归方程设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,这条直线就叫作回归直线.例2 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:使用年限x23456维修费用y2.23.85.56.57.0若由资料知y对x呈线性相关关系,试求:(1)回归方程y=a+bx;(2)估计使用年限10年时,维修费用是多少?分析 因为y对x呈线性相关关系,所以可以用线性相关的方法解决问题.解 (1)制表i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x4916253690=4,=5,x=90,xiyi=112.3于是有b==1.23,a=-b=5-1.23×4=0.08.∴回归方程为y=1.23x+0.08.(2)当x=10时,y=1.23×10+0.08=12.38,即
文档评论(0)