6a一元线性回归分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6a一元线性回归分析

6 多元线性回归分析 §1 一元线性回归分析 §2 多元线性回归分析 §3 残差分析 §4 最优回归方程的选取 §5 可线性化的非线性回归 引 言 现实世界中,某个变量与其他一个或多个变量之间常存在着一定的关系.一般来说,变量之间的关系可分为两类:一类是确定性关系,确定性关系是指变量之间的关系可以用函数关系来表达;另一类是非确定性关系,有些变量之间的关系是非确定性的关系,这种关系无法用一个精确的函数式来表示.例如,农作物的单位面积产量与施肥量之间有密切的关系,但是不能由施肥量精确知道单位面积产量,这是因为单位面积产量还受到许多其他因素及一些无法控制的随机因素的影响.又如,人的身高与体重之间存在一种关系,一般来说,人身高越高,体重越大,但同样高度的人,体重却往往不同.这种变量之间的不确定性关系称之为相关关系. 对于具有相关关系的变量,虽然不能找到他们之间的确定表达式,但是通过大量的观测数据,可以发现他们之间存在一定的统计规律,数理统计中研究变量之间相关关系的一种有效方法就是回归分析.“回归”(regression)一词是英国学者Francis Galton于1885年引入的. Galton(1822-1911)是一位人类学家,他是著名生物学家达尔文的表兄弟,早年学医,曾在剑桥大学念书。他在人类学和优生学研究中萌发的统计学思想,对生物统计的发展产生了深远影响,如“回归”、 “双变量正态分布”的概念等。 Galton一生写了9部书,发表了近200篇论文。1860年当选英国皇家学会会员,1909年被封为爵士,1910年获得英国皇家学会Copley奖。 后代的身高有向身高平均值靠拢的趋向. 离开均值越远,所受到回归的压力也越大。“回归”这个词就由此而来。 §1 一元线性回归分析 1.1 一元线性回归模型 1.2 模型的参数估计 1.3 线性关系的显著性检验 1.4 预测 1.5 控制问题 1.1 一元线性回归模型 对于x的一组值x1, x2, ?, xn作 独立试验,对Y 得出n个观察结果 y1, y2,?, yn,得到容量为n的样本 (x1, y1), (x2, y2),?, (xn, yn)。利用样本估计f(x) 。首先从散点图看出y与x的关系, 从而推测出f(x)的形式。若?(x) 为线性函数,设f(x) =a+bx,估计f(x) 的问题称为一元线性回归问题。 假设对于x的某个区间内的每一个值有 Y~N(a+bx,?2) Y= a+bx+? , ? ~N(0,?2) 称为一元正态线性回归模型。 1.2 模型参数的估计 回归直线通过样本散点图的几何中心 1.3 线性假设的显著性检验 对线性假设y=a+bx+?进行检验,线性系数b不应当为0 原假设 H0:b=0 备择假设 H1:b?0 T检验法 T检验法 在H0成立时,取统计量为 给定显著性水平?,H0的拒绝域为 计算出|t|的值,查出 T检验法 若 ,则拒绝H0;否则就接受H0 。拒绝H0,意味着回归效果是显著的。在回归效果显著的情况下,对回归系数作区间估计,可得出b的置信度为1-?的置信区间为 1.3 线性假设的显著性检验(F检验法) 方差分析 Syy自由度为n-1, Qe自由度为n-2, Sr自由度为1 方差分析 方差分析表 F检验法 原假设H0:b=0,备择假设 H1:b?0 选统计量 F检验法 对检验水平?,查表得F?(1,n-2), 计算出F值。 若FF?(1,n-2) ,则拒绝H0 ,说明回归效果显著; 若FF?(1,n-2) ,则接受H0 ,说明回归效果不显著。 例 为研究某一化学反应过程中温度x对产品得率Y的影响,测得数据如下: (1)求Y关于x的回归方程; (2)求?2的无偏估计量的值; (3)取? =0.05,问回归效果是否显著?若显著,求出b的置信度为0.95的置信区间; (4)作方差分析,检验回归效果(? =0.01)。 所以得回归直线方程为 写成另一种形式 (2) 这里45.3942.306,即|t|值在H0的拒绝域内,故拒绝H0 ,说明回归效果是显著的。 b的置信度为0.95(?=0.05)的置信区间为 1.4 利用回归方程进行预测 是Y对x的依赖关系的一个估计。对给定的x值,用回归方程确定Y的值,叫预测。 1.4 利用回归方程进行预测 2)区间预测 给定x=x0,Y的取值有一个置信度为1-?的范围,即置信区间,称为预报区间。 设在 x = x0 处对随机变量Y的观察结果为y0 区间预测 对任意的x,回归直线 y的下限: y的上限: 1

文档评论(0)

82393aa + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档