12_简单回归分析_2011.12.16 gu.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简单回归分析 顾 菁 2011.12.20 引言: 身高与体重存在相关(相关关系) 可否通过身高预测体重的平均水平? 新生儿的体重与体表面积存在相关 可否通过体重预测体表面积?(数量上的依存关系) 线性回归(linear regression),又称简单回归(simple regression), 非线性回归(nonlinear regression)* 把被估计或被预测的变量称为因变量(dependent variable),或称结局变量(outcome variable)或称反应变量(response variable),常用Y 表示; Y 所依存的变量称为自变量(independent variable),或称解释变量(explanatory variable),或称预测因子(predictor),常用X表示。 在上一章中,对14名40~60岁的健康妇女的体重(X)与基础代谢(Y)数据计算了相关系数 ,定量地描述了变量X与Y间的线性关联性。现在试用回归分析的方法,从预测的角度来描述基础代谢(Y)如何依存体重(X)的变化而变化的规律性。 样本线性回归方程(regression equation) : 二、线性回归模型的适用条件 三、回归参数的估计 (二) 回归参数的估计方法 例12-1 计算例11-1的基础代谢(Y)关于体重(X)的线性回归方程。 四、总体回归系数β的统计推断 (一) 方差分析 例12-2 试对例11-1资料的样本回归方程作假设检验(用方差分析) H0: β= 0 即基础代谢与体重之间无线性回归关系 H1: β≠0 即基础代谢与体重之间有线性回归关系 α= 0.05 例12-3 试对例11-1资料的样本回归方程作假设检验(用t 检验)。 (四) 决定系数 第二节 线性回归的应用 统计预测; 统计控制。 统计预测: 均数的置信区间: 当X为某定值和在给定置信度的情况下,欲知Y的总体均数的分布如何?我们可以估计总体中当X为某定值 时, Y的总体均数 的 置信区间 。 统计预测(续): 个体的容许区间: 预测是回归分析的重要应用之一,医学上常用在给定X值(预报因子)时,计算个体Y值的容许区间。所谓个体Y值的容许区间是指总体中X为某定值时,个体Y值的波动范围。  统计控制 例12-6 在硝酸钠的溶解试验中,测得在不同温度( )X下,溶解于100份水中的硝酸钠份数Y的数据见表12-3。若要求溶解于100份水中的硝酸钠份数在80份以上,温度应如何控制?设置信度为95%。 第三节 残差分析 当标准化残差图中散点的分布,绝大部分在?2倍标准差之间,在以0参考线的上下随机且均匀地散布时,可以认为模型与数据拟合得较好。一般认为在?3标准差以外区域出现的点所对应的原始数据为离群点,在?2标准差以外、?3标准差以内区域出现的点所对应的原始数据可能为离群点。 THE END Thanks 以X为横坐标,yhat 为纵坐标 斜率为,截距为 健康妇女的体重(X)与基础代谢(Y)两者都是随机变化的,那里Y 关于X的回归称为II型回归 通常利用专业知识来判断这项条件是否满足,即任意两个观察值之间不应该有关联性。如果该条件不满足,名义上有n个个体的资料,实际上提供的信息却没有这么多,导致回归估计值不够准确和精确 从样本数据的散点图来看,求解a和b实际上就是怎样“合理地”找到一条直线,使所有的数据点与它距离“最近”。一个自然的想法就是把 。。。 (二) t 检验 注意:对同一资料作总体回归系数β是否为零的假设检验,方差分析和t检验是等价的,并且有 的关系。 上一章对总体相关系数 的假设检验计算出的 等于这里的 ,这并不是巧合。当 Y与X两者都是随机变量时,我们既可以计算Y与X的相关系数,又可以做Y关于X的回归(II型回归); 对同一资料作总体相关系数 的假设检验和作总体回归系数β的假设检验分别得到 和 ,可以证明,二者相等。 (三) 总体回归系数β的置信区间 取值在0到1之间,且无单位。它反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的比例。 在实际应用中,通过用决定系数来反映回归的实际效果。如例12-1, =0.930,说明40~60岁健康妇女的体重信息大约可以解释自身基础代谢信息量的93%,还有剩余的7%的信息则通过体重以外的其它因素来解释。说明用体重来预测基础代谢量的实际效果较佳。 的(1- )置信区间为 (12

文档评论(0)

专业好文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6110200002000000

1亿VIP精品文档

相关文档