- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 10 章 10.1 回归分析概述 10.2 一元线性回归 10.3 多元线性回归 10.4 引入虚拟变量进行回归 3 ? 为确定变量之间的联系,用一些变量的变化说明另一个变 量的变化,并进一步对另一个变量的取值进行预测,这就 是回归分析。 ? 回归分析研究的是变量之间的相互关系,但这种关系不仅 是相关关系,而且是因果关系。因此回归分析要明确区分 因变量与自变量。如年龄对收入的影响。 ? 因变量( dependent variable) :要说明其变化的、对其进行 预测的变量。 ? 自变量 (independent variable) :用以说明或预测因变量的 变量 0 1 1 2 2 k k y b b x b x b x e ? ? ? ? ? ? K 回归模型 一元回归 非线性 线性 多元回归 非线性 线性 6 ? 两个定距变量的回归是用函数 y= f(x) 来分析的。我们最常 用的是一元回归方程 y=a+bx 。 ? 其中 x 为自变量, y 为因变量, a 为截距, b 为回归系数。 ? 常量: a 为 x 等于零时, y 的平均估计量。 ? 回归部分:它刻画因变量 y 的取值中,由因变量 y 与自变量 x 的线性关系所决定的部分,即可以直接由 x 估计的部分。 b 为回归系数,也是回归线的斜率。 ? 残差:估计值 ? 和每一个实测值之间的差称为残差。残差 表示因变量 y 除了自变量 x 以外的其他所有未进入模型或未 知但可能与 y 有关的随机和非随机因素共同引起的变异, 即不能由 x 估计的部分。 ? 最小二乘原理即残差的平方和最小。 ? 第一步:考察因变量的正态性。 例:根据数据“儿童 .sav ”,建立回归模型,考察儿童对电视 的接触时间与儿童的知识量之间是否有因果关系。 ? 第二步:考察因变量与自变量的线性关系。 添加回归趋势 线的方法: 双击图形,进 入图表编辑 窗口下的 Elements —— Fit Line at Total 选中 Linear ? 第三步:进行回归分析。 因变量 自变量 Pearson 相 关系数 回归方程的确定系 数 R 2 :表示自变量 能解释因变量变化 的 46.8% 。 进入模型的自变量 ? 确定系数 R 2 是测定回归 直线拟合优度的重要指标。 ? 总变差( TSS )是 估 计 时所产生的误差平 方和 ? 回归变差( RSS )是 和 之间产生的变差平方 和。 ? 剩余变差是 和 之 间产生的变差平方和。 y y 2 ( ) TSS y y ? ? ? ^ y y ^ 2 ( ) RSS y y ? ? ? y ^ y ^ 2 ( ) ESS y y ? ? ? TSS=RSS+ESS 2 1 RSS ESS R TSS TSS ? ? ? 对回归模型的显著性检验 回归平方和 RSS 残差平方和 ESS 如果 p 值小于 0.05 ,说 明 R 2 在统计上是显著的, 即有足够的把握认为总 体的回归斜率不为 0 。 通常只关心回归方程的斜率在统计上是不是显著的,而不关心截距的值以及它的显 著性水平。主要因为: ? 斜率 b 不仅表达了线性关系的方向,也表达了线性关系的强度,这也是对解释因 变量最有用的信息。截距 a 对解释因变量 y 的变化起不到任何作用。 ? 从实际应用的角度来说,截距是在 x = 0 时 y 的取值,这是一种特殊的情况,一般 不加以考虑。 ? 截距 a 只表示直线在坐标平面中的起点,如果把所有回归系数都进行标准化,这 时直线是过原点的,即截距为 0 。 所以,通常不关心截距 a 的值是否显著。即使不显著,也保留在方程中。 回归系数 如果 p 值小于 0.05 ,说明该自变 量的回归系数在统计上是显著的, 即有足够的把握认为 b 不为 0 。 常数项即 a 自变量的回 归系数即 b 建立回归方程: y=1.935+0.021x 其中 y 表示儿童的知识量评分 x 表示儿童接触电视的时间。 15 ? 将一元线性回归进行推广,引入多个自变量,以利用更多 的信息来解释因变量的变化,即可得多元线性回归方程 0 1 1 2 2 k k y b b x b x b x e ? ? ? ? ? ? K ? b 0 , b 1 , b 2 , ? , b k 是参数 , 称为偏回归系数 ? b i 表示假定其他变量不变,当 x i 每变动一个单位时, y 的 平均平均变动值 ? e 是被称为误差项的随机变量,说明了包含在 y 里面但不能 被 k 个自变量的线性关系所解释的变异性 ? y 是 x 1 , , x 2 , ? , x k 的线性函数加上误差项 e 例:某面向年轻人制作肖像的公司计划在国内开设几家分店, 收集了目前已设分店的销售数据(
您可能关注的文档
最近下载
- 成人胃肠功能障碍患者医学营养治疗指南PPT课件.pptx VIP
- hardenhu胡晓东先生简介.pdf VIP
- 工业相机与机器视觉知识考试题库资料及答案.pdf VIP
- 大语言模型通识 第1章 概述.ppt VIP
- 建设项目经济评价方法与参数(第三版)..pdf VIP
- 2025年本科院校基建处招聘面试预测题及答案.doc VIP
- 常见物质化学式书写练习.pdf VIP
- TB 10301-2020 铁路工程基本作业施工安全技术规程(附条文说明).docx VIP
- 大学生心理健康状况与干预策略研究.docx VIP
- 2024中央礼品文物管理中心招聘应届毕业生7人笔试备考题库及答案解析.docx VIP
原创力文档


文档评论(0)