8.1+成对数据的统计相关性+课件-2024-2025学年高二下学期数学人教A版(2019)选择性必修第三册.pptxVIP

8.1+成对数据的统计相关性+课件-2024-2025学年高二下学期数学人教A版(2019)选择性必修第三册.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第八章成对数据的统计分析§8.1成对数据的统计相关性§8.2一元线性回归模型及其应用§8.3列联表与独立性检验

8.1.1变量的相关关系我们知道,如果变量y是变量x的函数,那么由就可以唯一确定y。然而,现实世界中还存在这样的情况:两个变量之间有关系,但密切程度又达不到函数关系的程度。例如,人的体重与身高存在关系,一个人的体重与他的身高有关系。一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小。但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素。像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系。

两个变量具有相关关系的事例在现实中大量存在。(1)子女身高y与父亲身高x之间的关系。一般来说,父亲的个子高,其子女的个子也会比较高;父亲个子矮,其子女的个子也会比较矮。但影响子女身高的因素,除父亲身高外还有其他因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高。(2)商品销售收入y与广告支出x之间的关系。一般来说,广告支出越多,商品销售收人越高。但广告支出并不是决定商品销售收人的唯一因素,商品销售收人还与商品质量、居民收入等因素有关。(3)空气污染指数y与汽车保有量x之间的关系。一般来说,汽车保有量增加,空气污染指数会上升。但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业废气排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素。

(4)粮食亩产量y与施肥量x之间的关系。在一定范围内,施肥量越大,粮食亩产量就越高。但施肥量并不是决定粮食亩产量的唯一因素,粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响。因为在相关关系中,变量y的值不能随变量的值的确定而唯一确定,所以我们无法直接用函数去描述变量之间的这种关系。对上述各例中两个变量之间的相关关系,我们往往会根据自己以往积累的经验作出推断。“经验之中有规律”,经验的确可以为我们的决策提供一定的依据,但仅凭经验推断又有不足。例如,不同经验的人对同一情形可能会得出不同结论,不是所有的情形都有经验可循等。因此,在研究两个变量之间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的型,再利用模型进行估计或推断。

【探究】在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如下表所示。表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据。根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?编号1234567年龄/岁23273941454950脂肪含量/%9.517.821.225.927.526.328.2编号891011121314年龄/岁53545657586061脂肪含量/%29.630.231.430.833.535.234.6通过表格我们可以发现,随着年龄的增长,人体脂肪含量相对也会增长。

为了更加直观地描述上述成对样本数据中脂肪含量与年龄之间的关系,类似于用直方图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征。用横轴表示年龄,纵轴表示脂肪含量。表中每个编号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了如图所示的统计图。我们把这样的统计图叫做散点图。观察上图,可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增加的趋势。这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系。

从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关。由散点图,能够推断脂肪含量与年龄这两个变量正相关。

散点图是描述成对数据之间关系的一种直观方法。观察上面的散点图,从中我们不仅可以大致看出脂肪含量和年龄呈现正相关,而且从整体上可以看出散点落在某条直线附近。一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关。

一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关。

观察上面三幅散点图,你有什么发现?它们是线性相关吗?图(1)中的散点落在某条曲线附近,而不是落在条直线附近,说明这两个变量具有相关性,但不是线性相关;图(2)中的散点落在一条折线附

文档评论(0)

+ 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档