- 2
- 0
- 约5.6千字
- 约 54页
- 2019-01-08 发布于福建
- 举报
来线性回归
线性回归 线性回归的基本概念 线性回归分析是描述一个因变量Y (响应变量或应变量,dependent variable)与一个或多个自变量X (independent variable ) 线性依从关系。根据自变量数目的不同可分为一元线性回归和多元线性回归。 一元线性回归:仅有一个自变量 多元线性回归:有两个或两个以上的自变量。 第一节 一元线性回归 一.概念 根据若干观察数据(xi , yi , i=1,2,…n)找出描述两个变量x, y 之间关系的直线回归方程。 通用的表达式为: 式中: : 由自变量 X 推算应变量 Y 的估计值, a : 回归直线在Y 轴上的截距,即X=0时的Y值 a ? 0 a ? 0 a = 0 b: 样本的回归系数,即回归直线的斜 率,表示当X变动一个单位时,Y平 均变动 b 个单位。 b ? 0 b ? 0 b 与 r 符号一致。 二. 回归方程的计算 计算公式: 待产妇尿中雌三醇含量与产儿体重的关系 回归分析计算表 回归方程: 三.一元线性回归方程的假设检验 如果 ttα那么 Pα, 故不拒绝H1,不能认为回归系数为零。如果 ttα那么 Pα, 故不拒绝H0,不能认为回归系数不为零。同一数据对相关系数的检验和对回归系数的检验其结果相同。即 tr = tb 本例 t=4.14 (因为tb = tr= 4.14) 查表得 t 0.01 (29) =2.756 所以 t t 0.01 (29) 故 p0.01在α=0.05的水平上, 因为p0.01,所以拒绝检验假设Ho, 认为待产妇24小时尿中雌三醇含量与产儿体重之间存在直线回归关系。 2. R2 (R Square) : 判定系数或确定系数 SPSS操作步骤: Analyze --- Regression --- Linear 把因变量 产儿体重(y)选入 dependent 框 把自变量 尿雌三醇(x)选入 independent 框 method: 可选择 enter forward backward stepwise 点击statistics: 出现若干统计选项可供选择 Continue OK 结果 对回归方程的检验-------方差分析 尿中雌三醇推算产儿体重的回归分析及对截距和回归系数的显著性检验 绘制回归直线图 SPSS 操作步骤: graphs------scatter 选择 simple 单击 define 把产儿体重(y)变量选入 Y axis 框 把尿雌三醇(x)变量选入 X axis 框 OK 光标放在散点图中双击鼠标左键,然后单击 A , 出现scatterplot option 对话框 选择fit line中的 total, 单击fit option, 选择linear regression continue-----OK 待产妇尿雌三醇含量与产儿出生体重回归直线图 第二节 多元线性回归 1. 多元线性回归的概念 根据多个自变量的最优组合建立回归方程来预测因变量的回归分析称为多元回归分析。 多元回归分析的模型为: 或总体多元回归分析的模型为: (读epsilon ):残差 式中: 是根据所有自变量 x 算出的 y 的 估计值。 b0:为常数项 b1 、b2 、b3 … bn :y 对应于x1 、x2 、x3 … xn 的偏回归系数。 2. 多元线性回归对数据的要求和应用 (1)对数据要求 Y 为正态分布的连续的随机变量 X 为数值型变量 (2)应用 一组容易测量的自变量对因变量进行预测。 找出对因变量 y 的影响因素,并比较这些因素的作用大小。 3. 多元回归分析中的参数 (1)复相关系数R (multiple correlation coefficient): 表示回归模型中所有的自变量 x 与因变量 y 线性相关的密切程度的指标。实际上是yi 与其估计值 的简单线性相关系数,即pe
原创力文档

文档评论(0)