- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十二章 直线相关与回归(卫生学)
第十二章 直线相关与回归;探讨两个变量间的线性关系的一种统计分析方法
直线相关 (linear correlation)
(简单相关,simple correlation):
是探讨服从正态分布的两个变量X 和Y 有无线性相
关关系的一种统计方法
直线回归 (linear regression)
(简单回归,simple regression):
是探讨两个连续性变量X 和Y 间的数量依存关系的一种统计方法
先确定相关关系--- 再作回归,分析其数量上的依存关系;第一节 直线相关;表12-1.
15名学生的某蛋白表达量和肺活量. 试做相关分析.
;表达量;反映关联的密切程度和方向的指标----
相关系数(correlation coefficient)
样本的相关系数 r,总体的相关系数? .
一.相关系数的特点及意义:
1. 没有单位
2. 取值范围 : -1 ≤ r ≤ 1
3. r 的绝对值越接近于1,两变量的相关关系的密切程度越高.
4. r0 正相关, r0负相关; r =0无相关; r =1 完全相关;相关系数的定义 (Pearson积差相关系数);二. 相关系数的计算
;表:蛋白表达量和肺活量的相关分析.
;r = 0.7194 ;r = 0.7194 ;三. 相关系数的假设检验
基本思想: 检验总体相关系数是否为0, ?=0?
当实际测得的样本的相关系数r ? 0时,是总体的相关系数就不等于0,还是总体相关系数等于0,但因抽样误差造成的样本相关系数不等于0.
检验方法:
t 检验:
检验步骤: 1. 建立检验假设,确定检验水准
H0: ?=0, H1: ??0, α=0.05
2. 计算统计量 t 值;
3. 确定P值和判断结果
以自由度df = n-2, 查t界值表(P287,表9-9),确定P值.
;查表法:
根据自由度df = n-2,查相关系数 r界值表(表12-3), 确定P值. 算得的r值 表中的r值,则P 其对应的概率.;第二节 直线回归;一. 直线回归方程 (linear regression equation);回归方程中, a和 b取不同的数值可以获得不同的回归直线. 当获得的回归直线,能保证各实测点到直线纵向距离的平方和为最小时,这时的a和 b的值是最适宜的. 根据公式求出a和 b的值.;;;二. 样本回归系数的假设检验
基本思想: 同相关系数的假设检验.
即判断b是否从回归系数为 0 (β=0) 的总体中随机抽得的.
检验方法: t检验
也可以用相关系数的假设检验代替.
同一个样本相关系数有统计学意义,则回归系数必然有统计学意义.;检验步骤:
1.建立假设,确定检验水准
H0: β=0, H1: β?0, ?=0.05
2. 计算统计量
3. 确定P值,判断结果
查 t 界值表 ;第三节 直线相关与回归分析的关系;直线相关与回归的区别:
1. 对变量X、Y的要求不同
相关要求变量X、Y是正态分布的随机变量
回归要求变量Y是正态随机变量,X可以是精确测量
或严格控制的变量,也可以是正态分布的随机变量。
2. 意义不同
应用时应注意的问题:
1. 相关关系不一定是因果关系
2. 不能只根据相关系数的绝对值大小来推断有无相关关系及关系的密切程度,而应作假设检验
3. 回归方程一般只适用于自变量X的实测数据的范围内,不能随意外推.
4. 进行相关回归分析要具有实际意义. ;第四节 Spearman 等级相关;例12-2
;rs=-0.09; 直线相关回归分析的基本思路
;例1 ;例2 ;修改表 4种方法对104例静脉药瘾者检测结果 ;用描述正态分布的统计指标描述偏态分布资料 ;例4 ;例5 ;例6 ;例7
文档评论(0)