- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
7.2成对数据的线性相关性
1.结合实例,了解样本相关系数的统计含义.2.了解样本相关系数与标准化数据向量夹角的关系.3.会计算样本相关系数,并能根据相关系数的大小判断变量之间相关程度的强弱.
给定两个随机变量(X,Y)的7组成对数据:利用最小二乘法,可以得到Y关于X的线性回归方程为Y=0.143X+0.102.这时,X和Y是否具有线性关系呢?
如图可知这7组成对数据均位于单位圆上,所以X和Y不具备线性关系.当数据不多时,散点图变量相关关系定性推断但是对一般的情形又如何判断呢?问题1:如何判断两个随机变量是否具有线性关系呢?
为了解决这个问题,引入(线性)相关系数的概念,通过计算两个随机变量间的(线性)相关系数,来判断它们之间线性相关程度的大小.以本章第1.2节为例,已知Y关于X的线性回归方程为由可知,一定满足线性回归方程,∴①若X和Y的线性相关性好,则yi和(i=1,2,3)的差应该不大,最理想的状况应该是②
记向量u=,v=,则③式可记为v=u.线性回归方程最理想的状况是向量u,v共线(向量u,v的夹角为0或π).因此,可以用向量u,v夹角的大小来刻画X和Y线性相关的程度,记由①②式消去得③注:显然|r|≤1.|r|值越接近1,说明X和Y的线性相关性越强;|r|值越接近0,说明X和Y的线性相关性越弱.
问题2:在处理很多实际问题时,常常需要把一组数据x1,x2,...,xn,标准化,即把它转化为均值为0、方差为1的数据.如何实施呢?令(i=1,2,...,n),不难验证x1,x2,...,xn是均值为0、方差为1的数据,称它为原来数据x1,x2,...,xn的标准化.把x1,x2,...,xn和y1,y2,...,yn分别标准化,得到此时,向量(x1,x2,...,xn),(y1,y2,...,yn)的夹角余弦值与向量u=(…,),v=的夹角余弦值相同.
概念生成一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),...,(xn,yn),记称r为随机变量X和Y的样本(线性)相关系数.
为了计算的方便,再给出如下式子:
显然,样本(线性)相关系数r的取值范围为[-1,1].|r|值越接近1,随机变量之间的线性相关程度越强;|r|值越接近0,随机变量之间的线性相关程度越弱.当r0时,两个随机变量的值总体上变化趋势相同,此时称两个随机变量正相关;当r0时,两个随机变量的值总体上变化趋势相反,此时称两个随机变量负相关;当r=0时,此时称两个随机变量线性不相关.
例1:为了对2020年某校期末成绩进行分析,在60分以上的全体同学中随机抽取8位,他们的数学、物理成绩对应如下表:学生编学成绩x6872788185889193物理成绩y7066818379809289?
?
例2:计算下表两个随机变量之间的样本相关系数r,并谈谈通过计算发现了什么.x-5-4-30345y0345430解:因此,
由此可知,样本数据不具有线性相关性,建立线性回归方程是没有任何意义的.从图可以看出,表格中的数据都在同一个半圆上,与样本相关系数r的计算结果一致.注:当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关C
2.已知两个变量负相关,且相关程度很强,则它们的相关系数的大小可能是()A.-0.95B.-0.13C.0.15D.0.963.变量X,Y的散点图如图所示,那么X,Y之间的样本相关系数r最接近的值为()A.1 B
文档评论(0)