- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
線性计算方法
第八章 线 性 相 关
前面着重于描述某一变量的统计特征
或比较该变量的组间差别
两个随机变量之间的关系:
如体重与肺活量、
年龄与血压
是否存在线性联系?正向还是负向?联系的程度?
线性相关(linear correlation):线性联系?方向?程度?
8.1 线 性 相 关 概 念
独立随机的双变量正态分布样本
讨论两个变量X和Y的相关性。
样本:独立的、成对的观察值 (x1,y1),(x2,y2),…,(xn,yn)
例8.1 为讨论父子身高间的线性相关程度,南方某地在应届中学毕业生花名册中随机抽取20名男生,分别测量他们和他们的父亲的身高(cm),得样本资料如表8.1所示。
表8.1 20对父子的身高(cm)数据
编号 1 2 3 4 5 6 7 8 9 10 父高X 150 153 155 158 161 164 165 167 168 169 子高Y 159 157 163 166 169 170 169 167 169 170 编号 11 12 13 14 15 16 17 18 19 20 父高X 170 171 172 174 175 177 178 181 183 185 子高Y 173 170 170 176 178 174 173 178 176 180 问如何保证这是一份可供讨论线性相关的合格样本?
解 (1)随机抽取;
(2)互相独立?
散点图 (scatter plot)
座标轴:分别表示两个变量; n个点:构成一幅散点图(图8.1)
图8.2 典型散点图
图(a)和(c),正相关(positive correlation)
图(b)和(d),负相关(negative correlation)
图(e) 、(f) 、(g),Y和X无关联
图 (h),可能存在曲线型联系。
通常所说的相关就是线性相关,(e)到(h)均属不相关
对于不相关的情形,宜进一步澄清是否为曲线关系
8.2 相 关 系 数
Pearson积矩相关系数(product-moment correlation coefficient)
对双变量正态分布变量X和Y
(8.1)
总体相关系数,记为?
?=0,X和Y无线性相关或零相关(null correlaton)
? 0, 正相关
? 0, 负相关
?=1或-1, 完全相关(罕见!)。
样本相关系数,记为r
对于n对随机样本,X和Y的样本协方差:
(8.2)
lxy:X与Y的离均差乘积和
若所有离均差乘积平均后接近零,则表明部份个体的X和Y同方向,部份个体的X和Y反方向,总的说来,诸个体各循其道,杂乱无章
相反,若离均差乘积平均后为正,且距零较远,则表明多数个体的X和Y同方向,即正相关;
若离均差乘积平均后为负,且距零较远,则表明多数个体的X和Y反方向,即负相关。
协方差的大小与X,Y的取值单位有关,不同问题中的协方差不可比较。
相关系数:X和Y分别标准化之后的协方差。
数值介于-1和+1之间,且没有单位
(8.3)
lxx: X的离均差平方和 lyy:Y的离均差平方和
例8.2 试计算例8.1中父高X和子高Y的样本相关系数(假定系独立随机双正态样本)。
解 =3376, =3407, n=20
=571728, =581081, =576161
由(8.3)式得到,
8.3 相关系数的统计推断
样本相关系数r只是总体相关系数?的一个估计值。
样本相关系数也存在变异性。
得到线性相关的描述统计量r之后,还有必要对其所来自的总体进行统计推断。
相关系数的假设检验
H0: ?=0
直接查r界值表
或 t检验:
v=n-2 (8.4)
(8.5)
Sr: 样本相关系数r的标准差(也称标准误)。
例8.3 继例8.2中算得r=0.9296后,试检验相关是否具有统计学意义。
解 (1)直接查r界值表
可得到r0.001,18 = 0
文档评论(0)