第五讲线性回归分析.PPT

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五讲线性回归分析

* * * * * * * 从图中可以看出,学生化残差的点绝大部分落在绝对值为2的区间内,结合残差描述统计表,认为没有异常值。 六、回归方程的解释 结论报告: 线性回归分析结果显示,大学生的数学分析与高等代数成绩存在显著线性相关,自变量数学分析可以解释因变量高等代数80.4%的值,建立的回归方程为 y=43.1809+0.738x 其中y代表高等代数的平均成绩,x代表数学分析的平均成绩,可用数学分析的成绩预测高等代数的成绩。 六、回归方程的解释 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 3 如果y的所有子总体,其均值E(y1),E(y2),…E(yi)…,E(yn)都在一条直线上,则称为线性假定,其数学表达式为: E(yi)=a+bx 由于a和b对所有子总体都一样,所以a和b是总体参数。 4随机变量yi是独立统计的,即y1的数值不影响y2的数值,各y值之间没有关系。 四、回归方程的基本假定 以上可称作对总体有关线性、同方差和独立的假定。 出于检验需要,还要求y值得每一个子总体都满足正态分布。 四、回归方程的基本假定 1 检验原假设 总体变量x和变量y存在线性关系,即它们间存在 E(yi)=a+bx 则,对总体的线性假设可以写成如下形式: H0: b=0 H1: b0 2 线性回归平方和分解 TSS = RSS + SSE 五、回归方程的检验 误差平方和的分解 (误差平方和的关系) TSS = RSS + SSE 总平方和 (TSS) { 回归平方和 (RSS) 剩余平方和 (SSE) { { 误差分解图 x y y ? ? ? 误差平方和的分解 1) 总平方和(TSS—total sum of squares) 它反映了观测值yi围绕均值(ybar)总的分散程度,即yi-ybar的值。 2)回归平方和(RSS—sum of squares of regression) 它反映自变量 x 变化对因变量 y 取值变化的影响,由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 3) 残差平方和(SSE—sum of squares of error) 它反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 如果Yi=?i 即实际观测值落在样本回归“线”上,则拟合最好。 可认为,“离差”全部来自回归线,而与“残差”无关。 1 判定系数 2 相关系数 3 回归系数的显著性检验:t检验 4 回归方程的显著性检验:F检验 五、回归方程的检验 回归平方和占总平方和的比例 反映回归直线的拟合程度 取值范围在 [ 0 , 1 ] 之间 R2 ?1,说明回归方程拟合的越好;R2?0,说明回归方程拟合的越差 一元回归中,判定系数平方根等于相关系数 判定系数R2 (coefficient of determination) 五、回归方程的检验 拟合好坏的差异 左图的拟合较好,Y的变化主要由模型来解释,随机因素解释的比例较小 X Y X Y 度量拟合优度的指标:可决系数(判定系数)R2 相关系数r 相关系数r:是另一个被广泛用来测定拟合优度的指标;是描述变量x与y之间线性相关关系密切程度的一个数量指标。 它的计算公式如下: 五、回归方程的检验 调整的判定系数(adjust R2) R2有一个缺点,即R2随着解释变量个数的增加而增加,无论增加的解释变量在经济上是否有意义,情况总是如此。 给人一种感觉,似乎在模型中增加一个解释变量,模型的解释功能就会增强, R2就增大了,就会增加拟合优度。 为了避免这个问题,需要对可决系数进行自由度调整 ,以剔除变量个数对拟合优度的影响。 五、回归方程的检验 调整的判定系数可记为: 或 称为调整的判定系数 (adjusted coefficient of determination ) 六、回归方程的解释 1 Estimates:输出回归系数B值及标准误等 2 Confidence intervals:输出每个回归系数95%置信区间 3 Covariance matrix:多重回归分析时输出各个自变量的相关系数矩阵和方差、协方差矩阵。 五、回归方程的检验 1 Model fit:输出产生回归方程过程中引入和剔除回归方程的变量列表,并给出相关系数、判定系数、调整判定系数等内容 2 R squared change:输出每个自变量引入模型后引起判定系数值和F值得变化量 3 Part and partial correlations:输出自变量与

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档