[理学]5-1一元线性回归1.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]5-1一元线性回归1

反映了回归自变量的波动 反映了其它因素的影响 记 回归平方和 残差平方和 可证: 在计算时: 定理: 设 y1,y2,…,yn 相互独立,且 则上述记号下,有 (1) (2) (3) SR与Se、 独立. 关于 SR 与 Se 的分布 故: 进一步,若 H0 成立,则有 ②、选择检验统计量 ③、对于给定的显著性水平α,当 时, 就拒绝 H0, 认为回归方程有显著意义. t -检验 (1) (2)检验统计量: (3) (4) 若 t t1-?/2, 拒绝 H0 若 t ? t1-?/2, 不拒绝 H0 查 |r| 分布的临界值表 (附表9) 得 r1-?(n-2),当 |r|≥ r1-?(n-2) 时拒绝 H0 检验统计量: 样本相关系数 r 提出假设 H0: ρ = 0 vs H1: ρ ≠0 相关系数检验: 设ρ为二维总体 (x, y) 的相关系数 注: 称 r2为判定系数, 它度量了经验回归方程对观测数据的拟合程度. 0≤r2≤1, 它的值越大, 表明因变量与自变量之间的相关性越强. 例1(续):应用合金强度与碳含量的数据,得到了回归方程.试用相关系数法验证回归方程的显著性。 查表得临界值 r1-?(n-2)=r0.99(10)=0.708, 从而拒绝 H0. ?=0.01时, (1) y 与 x 之间的关系不是线性关系; 回归效果不显著的原因分析: (2) 影响 y 取值的,除 x 及随机误差外,还有其它不可忽略的因素; (3) y 与 x 之间可能不存在关系。 已知 ,寻求均值 的点估计与区间估计. (1) Ey0的点估计:即为回归方程计算所得回归值. 当回归方程经过显著性检验之后,可用来估计和预测. 五.估计与预测 1. Ey0的估计问题. (2) E y0 的区间估计: 由于 且与 相互独立. 置信区间为 其中 所求即 x=x0 时,对应 y0 的1-α取值区间. 由于 2. y0的预测区间.(个值预测) Ey0 的区间估计(均值预测) 所以 y0 的1-α预测区间为 其中 置信区间、预测区间、回归方程 xp y x ?x 预测上限 置信上限 预测下限 置信下限 1. 线性回归模型不宜用于长期预测。 2. 事物发展与历史数据的趋势有过大的差异。 例如:航空运量的增长在1996年以前是经济增长的线性趋势。 应用回归模型需要的注意问题 1996 * * * * * * * 124 Note: 1. As we move farther from the mean, the bands get wider. 2. The prediction interval bands are wider. Why? (extra Syx) 第一节 一元线性回归分析 一、变量间的两类关系 二、一元线性回归模型 四、回归方程的显著性检验 三、回归系数的最小二乘估计 五、估计与预测 变量间的关系 1.确定性关系或函数关系 y = f(x) 人的身高和体重 家庭的收入和消费 商品的广告费和销售额 粮食的施肥量和产量 股票的时间和价格 学生的期中和期末考试成绩,… 2. 非确定性关系 x y 实变量 随机变量 相关关系 一、变量间的两类关系 变量间相关关系不能用完全确定的函数关系表示,但某种意义下有一定的定量关系表达式,研究这种定量关系表达式就是回归分析的主要任务。(“回归”一词由英国生物学家兼统计学家高尔顿提出) regression y-1.73=0.8(x-1.73) (x, y) 采集样本信息 ( xi, yi ) 回归分析 散点图 回归方程 回归方程的显著性检验 对现实进行预测与控制 基本思想 如果数学关系式描写了一个变量 y 与另一个变量 x 之间的相关关系,则称其为一元回归分析;并且称 y 是响应变量 (Response Variable )(因变量:Dependent Variable); 称 x 是预报变量(自变量:Independent Variable、回归变量). 回归分析是根据变量观测数据分析变量间关系的常用统计分析方法. 通常把变量观测数据称为样本. 如果数学关系式描写了一个因变量与另外多个自变量之间的相关关系,则称其为多元回归分析. 第一类回归问题 当 x 也是 r.v 时,在知道 x 的取值后 y 的条件密度为 p(y|x). 我们关心的是 y 的平均取值 E(y|x),

文档评论(0)

ipbohn97 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档