网站大量收购独家精品文档,联系QQ:2885784924

12 简单回归.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
12简单回归整理

第12章 简 单 回 归 分 析 2012.10.15 Regression的含义: Golton最早在一项有关父亲和儿子身高的研究中提出回归的概念; 后人借用“回归”一词描述通过自变量(independent variable)的数值预测反应变量(response variable)的平均水平。 第一节 简单线性回归 线性回归的概念及其统计描述; 回归模型的前提假设; 回归参数的估计; 总体回归系数的统计推断。 一、线性回归的概念及其统计描述 例:对15名健康人凝血酶浓度(X)与凝血时间(Y )数据。 从预测的角度,描述反应变量(Y)如何随自变量(X)的变化而变化的规律性——数量上的线性依存关系。 二、回归模型的前提假设 线性回归模型的前提条件是(LINE) : 线性 (Linear) ; 独立 (Independent) ; 正态 (Normal) ; 等方差 (Equal variance) 。 三、回归参数的估计 (一) 回归参数估计的最小二乘估计(least squared estimation,LSE) : (二) 回归参数的估计方法 四、总体回归系数β的统计推断 (一) 样本回归系数b的标准误: (二)总体回归系数β的假设检验 H0: β=0, H1:β≠0 α=0.05 (三)总体回归系数β的置信区间 第二节 线性回归的应用 1. 总体回归线的95%置信带(相应X取值水平下,Y 的均值的区间估计) ; 2. 个体Y 预测值的区间估计 。 一、总体回归线的95%置信带 二、个体Y 预测值的区间估计: 第三节 残差分析 残差(residual)是指观测值与回归模型拟合值之差。 残差分析(residual analysis)旨在通过残差深入了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识别异常点等。 第四节 非线性回归 一般而言, 自然界的生命现象中绝对线性关系并不多见,但从相对与近似的观点出发,我们可以用前面已经提到线性回归模型来解决很多实际问题。 一、通过自变量的变换实现线性化 实践中有两类非线性关系, (1)通过自变量X的适当变换可线性化; (2)不能通过自变量X 的变换实现线性化。 可以进行线性变换的情形: 不能进行线性变换的情形: 二、变换自变量实现线性回归的步骤 1. 将观测数据(Xi, Yi), i=1,2,…,n作散点图,观察散点分布特征类似于何种函数类型; 2. 按照所选定的函数进行相应的变量变换; 3. 对变换后的数据用常规最小二乘法(OLS)作线性模型的参数估计。 4. 一般拟合多个模型,进行筛选。 为了研究某药物浓度与肾上腺素释放量的关系,选取10个给药物浓度水平,每种药物剂量水平上重复5次试验,观测结果如表12-3所示。欲用合适的回归模型描述该药品剂量与反应的规律。 小 结 1. 回归分析是从预测的角度,通过样本数据在最小二乘原则下建立线性回归方程,以便用自变量(X)的数值估计反应变量(Y)的数值及其变异; 2. 最小二乘原则是指能使观测样本的实测反应变量值与方程估计值之差的平方和最小的回归参数估计; 总体回归线的95%置信带与个体值Y的95%预测带均由对称于回归线的弧形曲线构成,而且后者比前者更远离回归线。 最常用的残差定义为观测值Yi与回归模型拟合值之差。通过绘制残差图可以简单而又直观地评价回归分析的前提条件(LINE)是否满足。 观察散点图是判断线性关系或非线性关系及其类型的既简单又直观的方法。 对于非线性情形, 仅当对自变量X进行变换可以线性化时才能采用线性回归的办法; 当需作Y的变换才能线性化时,建议用统计软件包直接作非线性回归。 例12-2 应变量Y 的适当变换可线性化!分析步骤同上? * * 回归方程(regression equation): 回归系数 LINE示意 使回归残差平方和最小的策略。 ——最小二乘原则。 H0成立时, 该统计量应服从自由度=n-2的t分布 (1-α)置信带的意义是:在满足线性回归的假设条件下,可以认为真实的回归直线落在两条弧形曲线所形成的区带内, 置信度为(1-α)。 当同时考虑X的所有可能取值时,个体Y值的95%预测区间形成一个带子,称为Y值的95%预测带,它比总体回归线95%置信带更宽。 (a)幂函数Y=aX±b (b)对数函数Y=a±bln(X) (c)指数函数Y=ae±bX (d)Logistic函数 *

文档评论(0)

chenchena + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档