【精品】三种相关分析.pptx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

三种相关分析

统计教研室

2011.12.6

三种相关分析类型

■Pearson直线相关

■Spearman秩相关■Kendall等级相关

2

Pearson直线相关

■定义:简单线性相关是描述在专业上有一定联系的两定量变量间是否有直线关系,以及直线关系的方向和密切程度的分析方法。

■适用条件:

(1)两个变量均为服从正态分布的随机变量,即要求他们服从双变量正态分布;

(2)每对数据对应的点在直角坐标系中呈现直线趋势。

3

Pearson直线相关

■例:探讨大鼠肝脏中胆固醇含量和锰含量之间是否存在直线关系

■基本思路:先考察两个变量在专业上是否存在一定的联系,若存在,则继续画出散点图,观察两变量间是否有直线变化趋势,若有,则通过计算相关系数r的大小,并对其进行假设检验,以及结合专业知识来评价得到的相关系数是否有实际意义(决定系数R²小于0.5时一般认为没有实际意义)

直线相关分析的一般步骤

1.先考察两个变量在专业上是否存在一定的联系,若存在,继续下面的步骤;

2.绘制散点图,观察两变量的变化趋势;

3.若散点图呈直线趋势,计算相关系数;

4.对相关系数进行假设检验;

5.必要时对总体相关系数进行区间估计。

5

正相关负相关完全正相关完全负相关

步骤一:绘制散点图,观察两变量的变化趋势

零相关零相关零相关

6

步骤二:若散点图呈直线趋势,计算相关系数

■2.1相关系数符号

样本相关系数r,总体相关系数p

2.2相关系数的计算

7

式中,Ixx、lyy分别表示X、Y的离均差平方和,

lxy表示X与Y的离均差乘积和,X、Y代表两个随机变量,r表示二者之间的相互关系。

lxx=Σ(X-X)²=2X²-(ΣX)²/n

lyy=Z(Y-Y)²=ZY²-(ZY)²/n

lxy=Σ(X-X)(Y-Y)=ZXY-(ZX)(ZY)/n

8

2.3相关系数的意义

(1)相关系数的取值范围:-1≤≤1,同样,-1≤p≤1

(2)相关系数的符号反映两变量间的相关方向:r0为正相关,r0为负相关

(3)相关系数的绝对值反映两变量相关的密切程度:|r越大,相关越密切。

9

步骤三:对相关系数进行假设检验

■3.1进行假设检验的原因:

■相关系数的大小会受到随机误差的影响,从同一总体抽出的不同样本会得到不同的样本相关系数。当r所代表的总体相关系数p=0时,r值可能并不等于0,为了尽可能排除抽样误差的影响,较客观地反映两个变量之间的相关关系,须对总体相关系数p进行假设检

验。

10

H₀:总体相关系数p=0

H₁:p≠0

a=0.05

直接查表法:求得r后,按v=n-2查r界值表。

3.2相关系数的假设检验

11

■式中分母部分S,为相关系数的标准误。

■求出t值后,查t界值表便可以得出P值。

t检验法

12

结论:

■若r0,且检验结果为P0.05,则认为两个定量变量之间呈正相关关系;

■若r0,且检验结果为P0.05,则可认为两个定量变量之间呈负相关关系。

13

步骤四:必要时对总体相关系数进行区间估计

■由于样本相关系数r的分布在p不等于零时呈偏态分布,所以在计算p的置信区间时需要先对r按下式作z变换:

■式中tanh为双曲正切函数,tanh-1为反双曲正切函数。

■变换后按正态近似原理计算z的1-α置信区间:

(z-ul-al₂/√n-3,z+ul-al₂/√n-3)

14

间:

r=tanhz或

■置信区间为

■最后对z的上下限做如下变换,得到p的1-α置信区

15

■例1:某保险公司希望理解总公司营业部加班时间与签发新保单数目的关系,收集的数据见下表。问签发的新保单数目与加班工作时间之间是否有相关性,并计算相关系数的95%置信区间。

签发的新保单

数目

加班工作时间

(h)

82521510705504809201350325

3.51.04.02.01.03.04.5

6701215

1.53.05.0

表1签发的新保单数目与加班工作时间数据

12345678

周序号

910

16

dataal;

inputidxy@@;

cards;

18253.522151.0

310704.045502.0

54801.069203.0

713504.583251.5

96703.0

文档评论(0)

yanxiaosa0 + 关注
实名认证
内容提供者

大家好!本人在此声明:本账号所有文档均出自网络,如有侵权请联系删除。收集归纳不易,请手下留情。

1亿VIP精品文档

相关文档