- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 变量个数 表现形式 变化方向 关系程度 函数关系 相关关系 总 结 概念 种类 测度 相关系数 显著性检验 * 温度(度) 28 28 29 29 29 30 31 31 31 32 销售量(箱) 80 85 84 88 95 98 105 102 110 116 * 6-* 第六章 相关分析 温度x(度) 28 28 29 29 29 30 31 31 31 32 销售量y(箱) 80 85 84 88 95 98 105 102 110 116 * 第三节 回归分析的基本问题 一、回归分析的概念 二、回归分析的主要内容 三、回归分析的特点 四、回归模型的种类 * 一、回归分析的概念 相关分析的不足:只能分析现象之间相关关系的方向和相关的密切程度,但不能判断现象之间具体的数量变动依存关系,也不能根据相关系数来估计或预测因变量y可能发生的数值。 回归分析:就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间数量变动关系的数学表达式,以便对因变量进行估计或预测的统计分析方法。 * 关系:相关分析的主要任务是研究变量间相关关系的表现形式和密切程度,而回归分析是在相关分析的基础上,进一步研究现象之间的数量变化规律。 变量xi与随机变量y的回归模型一般表示为 “因变量”或“被解释变量”(dependent variable) “解释变量”或“自变量”(independent variables) 随机变量 您知道“回归”这个词的本来含义吗? * 19世纪末,英国著名统计学家Francis Galton研究孩子及他们父母的身高时发现,身材高的父母,他们的孩子也高,但这些孩子平均起来并不像他们的父母那样高;对于比较矮的父母,他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应。回归这个术语便开始传播开来。 现在的回归分析已经没有原来的含义,但这种说法一直沿袭下来,重在表明这是研究数值变量之间关系的方法。 “回归”的本来含义 * 二、回归分析的主要内容 1.根据研究目的和现象之间的内在联系,确 定自变量和因变量; 2.确定回归分析模型的类型及数学表达式; 3.对回归分析模型进行评价与诊断; 4.根据给定的自变量数值确定因变量的数值。 * 三、回归分析的特点 1.回归分析必须根据研究目的确定其中一个为因变量,其余为自变量而相关分析可以不用区分自变量和因变量; 2.相关分析中,两个变量要求都是随机的,而在回归分析中,要求因变量是随机的,而自变量的值则是给定的; 3.若变量之间互为因果,则可以求出两个回归方程,而两个变量之间只能求出一个相关系数; 4.回归方程有较强的应用性。 * 四、回归分析模型的种类 线性回归 非线性回归 一元回归 线性回归 非线性回归 多元回归 回归模型 * 一、简单线性回归分析 (一)简单线性回归模型 理论模型 估计模型 回归参数 回归参数的估计值 两点说明:1. a是直线的截距,b是直线的斜率 ;2.因变量y的估计值记为yc 误差项 * 一、简单线性回归分析 (一)简单线性回归模型 理论模型 估计模型 回归参数 回归参数的估计值 两点说明:1. a是直线的截距,b是直线的斜率 ;2.因变量y的估计值记为yc 误差项 * (二)参数估计 销售额 流通费用 w w w w w w w w w w The question is: Which straight line fits best? 思路:离差的平方和最小 最小二乘法 * 整理得: 最后解得: 设估计模型为 * 斜率b的含义为:自变量x每增加(或减少)一个单位,因变量y将平均增加(或减少)b个单位。 * 例:某企业对车间9名学徒工进行调查,得到学徒期限与每天产量情况如右表所示,要求建立以日产量为因变量的回归方程。 所以回归方程为yc=0.83+87.5x * 斜率b的其他公式 回归系数b和相关系数r是有联系的 * 1.变差的产生 在直线回归中,因变量y的大小取值是不同的,它围绕平均值上下波动。y 取值的这种波动称为变差。变差来源于两个方面:一是由于自变量 x 的取值不同造成的;二是除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响造成的。 (三)回归方程判定系数 * 两边平方得 两边求和并化简得 * 2.变差的分解 反映由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称可解释的变差。 回归变差 (SSR) TSS = SSR + SSE 总变差 (TSS) { 剩余变差 或残差 (SSE) { { * 回归变差占总变差的比例,称为判
文档评论(0)