15-直线相关与回归解读.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
15-直线相关与回归解读

回归变异计算方法 回归离均差平方和,简称回归平方和 回归均方 本例 残差变异计算方法 残差变异MS残(variation caused by residuals):残差变异又称残差均方(mean of squares for residuals)。 它指的是由除x以外所有其它因素导致的y的变异,因此,其含义是y的变异中不能由x解释的部分。 它在性质上显然属于随机变异。 计算方法 本例 总变异与回归变异和残差变异的关系 总变异中的离均差平方和自由度都可以被分解为上述两个部分。根据离均差平方和和自由度的可加性,有 回归模型的方差分析 变异来源 DF SS MS F 值 P值 回归 1 2.50574 2.50574 17.16 0.0003 残差 29 4.23426 0.14601 总变异 30 6.74000 a和b的显著性检验 这一检验通常采用t检验法。该检验的目的是判断样本回归系数是否是从回归系数为0的总体中随机抽取的。或者说,如果总体回归系数为0,样本回归系数不等于0是否由不寻常的抽样误差所导致。 直线相关与回归 相关与回归的概念 经典相关分析要求X与Y都是随机变量,而且服从双变量正态分布。相关关系的统计量使人们对变量间的相关关系是否成立、相关的性质和强弱等有了量化依据。它采用严格的数学计算和概率分布理论使得经典哲学中对事物间的“相关”的定性判断和解释有了定量的前提,也就是说,它使得定性判断以定量分析为基础,因而使前者具有更高的客观性和精确性。 回归分析则是试图在变量间建立一种数学公式化的理想模型,通过这个模型,我们可以用一个(组)变量来估计或预测另一个(组)变量的取值,即寻求反应变量对于因变量间依存比例的数量。 直线相关分析 二维散点图 作为相关分析最直观的表达形式莫过于用两变量值绘制的散点分布图 数据表达格式 实例 为探讨产妇尿液中雌三醇含量与初生儿体重是否有关,以便尽早根据产妇产前尿中雌三醇含量水平估计胎儿是否超重,并判断生产过程的风险,某产科医师测量了31例待产妇24小时的尿雌三醇及其初生儿体重,数据记录如下表。 散点图 相关分析的基本思想 相关系数r的算法 相关系数的计算 相关系数计算的基本统计量 变量名 常数项 x y 常数项 N=31 Σx=534 Σy=99.2 x Σx=534 Σx2=9876 Σxy=1750 y Σy=99.2 Σxy=1750 Σy2=324.18 相关系数的计算 相关系数 总体相关系数的显著性检验 样本只是总体的一个随机代表,由于抽样误差不可避免,样本相关系数r并非恰好等于总体的相关系数?,或者说即使总体相关系数? = 0,样本相关系数r也不恰好等于0,因此,样本相关系数r必须接受“是否来自总体相关系数? = 0”的假设检验。 相关系数的显著性检验 需要对样本相关系数r的抽样误差进行估计,确定其发生的概率,从而在一定的概率水平上对? = 0的假设作出推断。 假设检验的目的也是为了对样本所代表的总体相关系数?是否为0作出概率推断。 直接查r的界值表 ;t检验法 t检验法 检验的统计量 自由度 v = n –2 本例 总体相关系数的可信区间估计 首先对样本相关系数r进行以下函数变换 按正态近似的原理 ,1-?的可信区间 最后对此区间的上下限取tanh-1的反函数tanh,就可以得到总体相关系数 ? 的1-? 可信区间,即 可信区间估计 本例总体相关系数的95%置信区间为: 0.6009 ~ 0.6186 秩相关 适用条件: ①资料不服从双变量正态分布而不宜作积差相关分析; ②总体分布型未知,一端或两端是不确定数值(如<10岁,≥65岁)的资料; ③原始数据用等级表示的资料。 一、Spearman秩相关 1. 意义:等级相关系数rs用来说明两个变量间直线相关关系的密切程度与相关方向。 2. 计算公式 例11-4 某地研究2~7岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2,试用秩相关进行分析 表11-2 急性白血病患儿的血小板(109/L)和出血症状 病人编号 血小板数 秩次 p2 出血症状 秩次 q2 pq X p Y q (1) (2) (3) (4) (5) (6) (7) (8)=

文档评论(0)

little28 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档