2、一元线性回归概览.ppt

  1. 1、本文档共149页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回归模型 (regression model) 回答“变量之间是什么样的关系?” 方程中运用 数值型的因变量(响应变量) 被预测的变量 1 个或多个数值型的或分类的自变量 (解释变量) 用于预测的变量 3. 主要用于预测和估计 回归模型的类型 一元线性回归 涉及一个自变量的回归 因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量(dependent variable)或目标变量、内生变量、预测子。用y表示 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable)或控制变量或外生变量或预测元。用x表示 因变量与自变量之间的关系用一个线性方程来表示 一元线性理论回归方程 (regression equation) E( y ) = ?0+ ?1 x (2.2) 估计(经验)的回归方程 (estimated regression equation) 一、普通最小二乘估计 估计方程的求法 (例题2.1分析) 距消防距离火灾损失回归方程的图示 用Excel进行回归分析 第1步:选择“工具”下拉菜单 第2步:选择“数据分析”选项 第3步:在分析工具中选择“回归”,然后选择“确定” 第4步:当对话框出现时 在“Y值输入区域”设置框内键入Y的数据区域 在“X值输入区域”设置框内键入X的数据区域 在“置信度”选项中给出所需的数值 在“输出选项”中选择输出区域 在“残差”分析选项中选择所需的选项 ?用Excel进行回归分析 (回归直线的拟合优度) 变 差 1. 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 ■ 由于自变量 x 的取值不同造成的 ■ 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 2. 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示 变差的分解 (图示) 离差平方和的分解 (三个平方和的关系) 事实上, 有: 决定(判定)系数R2 (coefficient of determination) 定义:回归平方和占总离差平方和的比例 一、t 检验(回归系数的显著性检验) 回归系数的检验 (样本统计量 的分布) 回归系数的检验 (检验步骤) 提出假设 ◆ H0: b1 = 0 (没有线性关系) ◆ H1: b1 ? 0 (有线性关系) 计算检验的统计量 二、F检验(线性关系的检验) 1. 检验自变量与因变量之间的线性关系是否显著(直接从回归效果检验回归方程的显著性) 2. 将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著 回归均方:回归平方和SSR除以相应的自由度(自变量的个数p) 残差均方:残差平方和SSE除以相应的自由度(n-p-1) 什么是自由度 模型中样本值可以自由变动的个数,称为自由度。 自由度 = 样本个数 — 样本数据受约束条件(方程)的个数 例如,样本数据个数为n,它们受k个方程的约束(系数矩阵秩为k),那么,自由度df = n-k SST、SSR、SSE的自由度 对应于平方和分解的自由度的分解 n-1 1 n-2 SST = SSR + SSE 总自由度dfT 回归自由度dfR 残差自由度dfE 自由度分解:dfT= dfR +dfE 线性关系的检验 (检验的步骤) 提出假设 H0:?1=0 线性关系不显著 相关关系 (类型) 相关关系的描述与测度 散点图(scatter diagram) 相关关系的描述与测度 相关系数(correlation coefficient) 1. 对变量之间关系密切程度的度量 2. 对两个变量之间线性相关程度的度量称为简单相关系数 3. 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 4. 若是根据样本数据计算的,则称为样本相关系数,记为 r 相关系数 (计算公式) ◆ 样本相关系数的计算公式 相关系数 (取值及其意义) 相关系数(取值及其意义) 1. r 的取值范围是 [-1,1] 2. |r|=1,为完全相关 ■ r =1,为完全正相关 ■ r =-1,为完全负正相关 3. r = 0,不存在线性相关关系 4. -1r0,为负相关 5. 0r1,为正相关

文档评论(0)

贪玩蓝月 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档