- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
·选择性必修第三册·第七章随机变量及其分布列8.1.2样本相关系数
学习目标1.了解样本相关系数公式的推导关系2.掌握样本相关系数公式,并会运用.(重点)3.了解样本相关系数与标准化数据向量夹角的关系,掌握样本相关系数的范围(难点)
情景导入8.1.2样本相关系数01
创设背景,引入新知通过上一节的学习,华华提出了自己的一些疑问:问题1:由上图可判断出图①是负相关,图②是正相关,那么能否判断出图②的相关性比图①强?不一定.问题2:怎样定量刻画两个变量的相关性?可以用样本相关系数公式计算.
样本相关系数8.1.2样本相关系数02
探究新知通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.问题:能否引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?
探究新知?问题:能否引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?
探究新知利用上述方法处理上表中的数据,得到由图.我们发现,这时的散点大多数分布在第一象限、第三象限,大多数散点的横、纵坐标同号.显然,这样的规律是由人体脂肪含量与年龄正相关所决定的.
探究新知如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如下图(1)所示;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如下图(2)所示.
探究新知线性负相关线性正相关无相关关系非线性相关线性负相关线性正相关无相关关系非线性相关(x,y)基本异号(x,y)基本同号数据预处理的常用方法:中心化(零均值化)中心化
探究新知思考??根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
探究新知思考Lxy的大小是否一定能度量出成对样本数据的相关程度吗?因为Lxy的大小与数据的度量得有关,所以不宜直接用它度量成对样本数据相关程度的大小.?
探究新知?
探究新知定义?样本相关系数
探究新知样本相关系数r是一个描述成对样本数据的数字特征,它反映了两个随机变量之间的线性相关程度.样本相关系数r的正负性和绝对值的大小可以反映成对样本数据的变化特征当r0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.当r0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.|r|的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.
探究新知思考相关系数r的取值范围是多少呢???
探究新知??∴样本相关系数r的取值范围为[-1,1]
探究新知相关系数|r|=1时,成对样本数据之间具有怎样的关系呢??思考
探究新知总结相关系数的性质:①当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关.②|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系(但不排除它们间有其他相关关系);当|r|=1时,成对数据都落在一条直线上.
探究新知观察以下散点图,判断成对数据间的相关关系要求图(1)中成对样本数据的正线性相关程度很强.图(2)中成对样本数据的负线性相关程度比较强.图(3)中对样本数据的线性相关程度很弱.图(4)中成对样本数据的线性相关程度极弱.
探究新知在实际中,获得总体中所有的成对数据往往是不容易的.因此,我们还是要用样本估计总体的思想来解决问题.也就是说,我们先要通过抽样获取两个变量的一些成对样本数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了解两个变量之间的相关程度.对于简单随机样本而言,样本具有随机性,因此样本相关系数r也具有随机性.一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.
探究新知例1.根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.编号/1234567891011121314年龄/岁2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6解:先画出散点图,如图所示.观察散点图,可以看出样本点
您可能关注的文档
- 7.1.2 全概率公式(教学课件)-2024-2025学年高二数学(人教A版2019选择必修三).pptx
- 7.2 离散型随机变量及其分布列(教学课件)-2024-2025学年高二数学(人教A版2019选择必修三).pptx
- 7.2类比推理及其方法(课件)-2024-2025学年高二政治(统编版选择性必修3).pptx
- 7.3.1 离散型随机变量的均值(教学课件)-2024-2025学年高二数学(人教A版2019选择必修三).pptx
- 7.3.2 离散型随机变量的方差(教学课件)-2024-2025学年高二数学(人教A版2019选择必修三).pptx
- 8.2.1 一元线性回归模型(教学课件)-2024-2025学年高二数学(人教A版2019选择必修三).pptx
- 8.4.2 空间点、直线、平面之间的位置关系 (教学课件)-2024-2025学年高一数学(人教A版2019必修二).pptx
- 8.5.1 直线与直线平行 (教学课件)-2024-2025学年高一数学(人教A版2019必修二).pptx
- 8.5.2 直线与平面平行(第1课时)直线与平面平行的判定(教学课件)-2024-2025学年高一数学(人教A版2019必修二).pptx
- 8.5.2 直线与平面平行(第2课时)直线与平面平行的性质(教学课件)-2024-2025学年高一数学(人教A版2019必修二).pptx
文档评论(0)