- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
8.1.2样本相关系数;
通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变
量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关
等.散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引人均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?
对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,
y2),???,(xn,yn),其中x1,x2,???,xn和y1,y2,???,yn的均值分别为x和y.将数据
以(x,y)为零点进行平移,得到平移后的成对数据为
(x1—x,y1—y),(x2—x,y2—y),...,(xn—x,yn—y),并绘制散点图.;
通过绘图分析可得,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如图(1)所示;
如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如图(2)所示.;
思考1根据上述分析,你能利用正相关变量和负相关变量的成对样本数据
平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数
字特征吗?
利用散点(xi—x,yi—y)(i=1,2,...,n)的横、纵坐标是否同号,可以构造一个量;
思考2Lxy的大小是否一定能度量出成对样本数据的相关程度吗?
因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.我们用
分别除xi—x和yi—y(i=1,2,...,n),并仿照Lxy的构造可得
我们称r为变量x和变量y的样本相关系数.;
(xi—x)(yi—y)
r=
·(xi—x)2.·(yi—y)2;
+…+同理可得;;
图(1)中成对样本数据的正线性相关程度很强.
图(2)中成对样本数据的负
线性相关程度比较强.
图(3)中对样本数据的线性
相关程度很弱.
图(4)中成??样本数据的线
性相关程度极弱.;;
练习3.两个变量x,y的样本相关系数r1=0.7859,两个变量u,v的样本相关系数r2
=-0.9568,则下列判断正确的是(C)
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强;
8.对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较
,正确的是(A);
练习1判断正误(正确的打“√”,错误的打“×”)
(1)相关关系是一种非确定性关系,体现的不一定是因果关系
系.(√)
(2)散点图越接近某一条直线,线性相关程度越强,样本相关
(3)散点图可以直观地分析出两个变量是否具有相关性.(√
(4)若变量x,y满足函数关系,则这两个变量线性相关.(×;
解:由样本数据可得x≈48.07,y≈27.26,(xi—x)(yi—y)≈1054.34,
≈0.97.
由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.;
解:由样本数据可得
;;
根据上表数据,计算y与x的样本相关系数r,并说明y与x的线性相关程度.
(附:若0.75≤|r|≤1,则认为y与x的线性相关程度很强;若0.3≤|r|0.75,则认为y与x的线性相关程度一般;|r|≤0.25,则认为y与x的线性相关程度较弱);
请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变
化趋势的特征.
解:由样本数据可得=42,xiyi=2841,=753,=13350.;
课本103页
练习4.已知变量x和变量y的3对随机观测数据(2,2),(3,-1),(5,-7),计算
成对样本数据的样本相关系数.能据此推断这两个变量线
您可能关注的文档
- Amazing animals Amazing animals PartB(2) Let's learn~Listen and chant 课件 (共18张PPT)(完整版).pptx
- Amazing animals Amazing animals PartB(3) Start to read 课件 (共24张PPT)(完整版).pptx
- 冀教版(2024)七年级上册 All about me Lesson 1课件(共28张PPT,含内嵌视频).pptx
- 冀教版(2024)七年级上册 All about me Lesson 2课件(共21张PPT).pptx
- 冀教版(2024)七年级上册 All about me Lesson 3课件(共25张PPT,含内嵌视频).pptx
- 冀教版(2024)七年级上册 All about me Lesson 4课件+音频(共19张PPT).pptx
- 冀教版(2024)七年级上册 All about me Lesson 5课件+音频(共25张PPT).pptx
- 冀教版(2024)七年级上册 My family Lesson 1课件+音频(共23张PPT).pptx
- 冀教版(2024)七年级上册 My family Lesson 2课件+音频(共26张PPT).pptx
- 冀教版(2024)七年级上册 My family Lesson 4课件(共20张PPT).pptx
文档评论(0)