回归(第一讲)摘要.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元线性回归分析及其应用 天津工业大学管理学院 王大海 引 言 二、回归分析的主要作用 验证变量间是否存在相关性 该用法在实证研究中得到最广泛的应用 预测 三、回归分析与相关分析的区别 1. 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。 2. 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 3. 相关系数r与回归系数b 。r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。 四、变量间因果关系的判定依据 虽然,回归分析是用来处理一个因变量与另一个或多个自变量之间的关系,但它并不一定表明因果关系的存在;也就是说,它并不意味着自变量是原因,而因变量是结果。 两个变量是否存在因果关系,必须以(经济、管理等)理论为判定基础。 第一节 多元线性回归分析 方法概述 一、基本概念 回归的含义 回归分析是用来研究一个变量与另一个(或多个变量)之间的关系。 前者称之为被解释变量(explained variable)或因变量(dependent variable) 后者称为解释变量(explanatory variable) 或自变量(independent variable) 例如: 研究产品的销量与用于产品宣传的广告费之间的关系; 因变量——销售量 自变量——广告费 我们用Y代表因变量, X代表自变量。 如果有多个解释变量,我们将用适当的下标,表示各个不同的X。 例如,X1,X2,X3等等。 概念:总体回归线 下面通过一个例子予以说明。 某城市A产品生产企业共有5 5个(总体),下表给出了这些企业产品价格(元)与A产品月销量(万件)的有关数据。 从上表可以看出:有7个企业产品价格为10.1元,其销量分别在45到51万件之间,7个企业的平均销量为48万件。 类似地,有5个企业产品价格为10.7元,产品销量分别在32到40万件之间,5个企业平均销量为36万件。 以销量(Y)为纵轴,以价格(X)为横轴,对表中的数据作散点图。从散点图可以看出:对每个X,有若干个Y与之对应。 例如,当X=10.1时,有7个Y值与之对应 当X=10.4时,相应地有6个Y值,等等。 对每个X,计算出一个Y的均值。将这些均值点连起来,构成一条直线。 我们称该直线为总体回归直线(Population Regression Line,PRL)。 概念要点:总体回归线 总体回归线: Y =β0+β1X 它描述的是X与Y的均值之间的关系。 概念:随机误差 每个个体的Y值与总体回归线之间的距离(可正可负) 概念:回归模型(一元线性回归) 概念:回归模型(多元线性回归) 随机误差项主要包括下列因素的影响: 1)在解释变量中被忽略的因素的影响; 2)变量观测值的观测误差的影响; 3)模型关系的设定误差的影响; 4)其它随机因素的影响。 概念:样本回归线 现实中,总体中含有数量庞大的个体(本例中,总体只有55个体) 实际中,总体回归线是未知的。 我们的目的就是要了解总体回归线。 为此,我们通常从庞大的总体抽取少量个体,构成一组样本。根据该样本,对总体回归线进行估计,或对有关参数进行推断。 样本回归线 根据一组样本所确定的直线,称为样本回归线(sample regression lines, SRL)。 样本回归线是总体回归线的估计。 样本回归线通常与总体回归线有一定差异。 概念:残差 每个样本点与样本回归线纵向距离(可正可负) 残差 回归分析的基本步骤 1.用于检验因果关系 2.用于预测 用于检验因果关系的基本步骤 (1)确定自变量和因变量,建立线性回归模型 (2)对模型进行评价 对模型整体显著性进行检验 如果不能通过该检验,通常需要修改模型(通常需要重新选择自变量) 对模型的拟合优度进行评价 (3)利用样本数据对回归方程的各个参数进行估计。 (4)对有关的回归系数是否等于零进行统计检验。 (5)根据回归系数检验的结果,作出实证结论 (6)其他——对模型进行诊断与评价。 用于预测的基本步骤 (1)确定自变量和因变量,建立线性回归模型 (2)对模型进行评价 对模型整体显著性进行检验 如果不能通过该检验,通常需要修改模型(通常需要重新选择自变量) 对模型的拟合优度进行评价 (3)利用样本数据对回归方程的各个参数进行估计。 (4)对模型进行优化(适当剔除解释能力差

文档评论(0)

富贵礼包 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档