自考高数经管类第九章回归分析课堂笔记.docxVIP

  • 11
  • 0
  • 约4.53千字
  • 约 13页
  • 2022-05-28 发布于境外
  • 举报

自考高数经管类第九章回归分析课堂笔记.docx

第九章 回归分析 在现实世界中, 不少变量之间是存在着一定的关系的, 一般来说, 这种关系大体上可分 为两类,一类是确定性的,即函数关系。例如,电路中的电压V,电流 I,电阻 R 三者间有 关系 。另一类 是非确定性的, 这类变量之间虽有一定的关系却又并不完全确定, 例如 人的血压与年龄有关, 炼钢过程中含碳量与精炼时间有关, 农作物产量与施肥量和单位面积 的播种量有关……这些变量之间虽有一定联系, 但又不能用普通函数关系式来表达。 例如对 给定的施肥量和确定的播种量, 农作物的产量还是不能完全确定的。 事实上, 这些变量是随 机变量或至少其中一个是随机变量。这种非确定性的关系称为相关关系。 回归分析是研究相关关系的一种数学工具, 是数理统计学中最常用的统计方法之一, 在 生产实践和科学研究中有着广泛的应用。本章仅简单介绍一元线性回归分析。 9.1 回归直线方程的建立 为了说明一元线性回归的数学模型,我们先看一个实际例子。 例 9- 1 某种合金的抗拉强度 y〔kg/mm2 〕与其中的含碳量 x〔%〕有关,现测 12 对数 据如表 9- 1 所示。 【答疑编号:针对该题提问】 表 9- 1 0.1547.50.1649.0xy0.1143.5 0.15 47.5 0.16 49.0 x y 0.11 43.5 0.13 45.5 0.12 45.0 0.14 45.0 0.17 53.0 0.18 50.0 0.20 55.0 0.21 55.0 0.23 60.0 42.0 为了了解其相关关系的表达式,在坐标上以〔xi ,yi〕,i=1,2,… ,12 为点,画出散点 图如图 9- 1 所示,这些点大体上散布在某条直线的周围,又不完全在一条直线上,从而可认 为 y 与x 的关系根本上是线性的,而这些点与直线的偏离是由其他一切随机因素的影响造成 的。一般说来,含碳量x 是一个可观测或可控制的普通变量,而对任意一个含碳量x,相应 的抗拉强度是一个随机变量 Y,实际观测值 y 是 Y 的一个可能取值。随 x 的变化, Y 的观 测值线性变化的趋势可表示为 。 〔9.1.2〕 其中 表示 Y 随 x 的变化而线性变化的局部, 是一切随机因素影响的总和,称 为随机误差项,它是不可观测其值的随机变量,在Y 的方差 时, 是一个 E〔 〕 =0 ,D〔 〕的随机变量,在涉及分布时,可进一步假定 。 一般地, 将 x 取一组不同的值, x1,x2,…,xn,通过试验得到对应的 Y 的值 y1,y2,…, yn ,这样就得到 n 对观测值〔xi ,yi〕,i=1,2,… ,n。可把 y 的值看成由两局部叠加而成, 一局部是 x 的线性函数 ,另一局部系试验过程中其他一切随机因素的影响。因此, 由〔9.1.2〕式可认为 xi 与 yi 之间有如下关系 ,〔i=1,2, … ,n〕, 〔9.1.3〕 且各 相互独立。 此式就是一元线性回归的数学模型。 回归分析的根本问题是依据样本〔xi ,yi〕,i=1 ,2, … ,n 解决如下问题: 〔1〕未知参数 及 的点估计,假设 分别为 的估计, 由此得 。 〔9.1.4〕 〔9.1.4〕是抽述 Y 与 x 之间关系的经验公式。我们称〔9.1.4〕式为 Y 关于x 的一元线性回 归方程,它就是我们要求的 y 与 x 之间的定量关系的表达式,其图像便是类似图 9- 1 中的 直线,称此直线为回归直线, 也称为回归系数,它是回归直线的斜率, 称为回归常数, 它是回归直线的截距。 方程,它就是我们要求的 y 与 x 之间的定量关系的表达式,其图像便是类似图 9- 1 中的直线, 称此直线为回归直线, 也称为回归系数,它是回归直线的斜率, 称为回归常数,它是回归 直线的截距。 〔2〕回归方程的显著性检验, 在实际问题中, y 与 x 之间是否存在关系式 是要经过检验的。 下面先讨论未知参数 及 的点估计问题。 要求出回归方程〔9.1.4〕,就是要求出 的估计。而求此估计的一个自然而又直观 的想法便是希望对一切 xi,,观测值 yi 与回归值 的偏离到达最小。为此,一般 采用最小二乘法来求 的估计。对样本〔xi ,yi〕,i=1,2 ,… ,n 令 它表示当用〔9.1.2〕式来逼近Y 时, n 个样品的总的误差平方和。最小二乘法的根本思 想是选取 的估计值 ,使 其中右端 min 是对一切 的容许值取的 Q 的最小值。 由于 是 的非负二次函数,其最小值必定存在,同时它

文档评论(0)

1亿VIP精品文档

相关文档