(三)线性回归.pptx

(三)线性回归

数据挖掘方法三线性回归回归定义回归:通指那些用一个或多个自变量(X)来预测因变量(Y)的方法。通常,回归分析可以用来挑选与因变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过X来预测因变量。在统计学中,线性回归(Linear Regression)是利用线性关系对一个或多 个自变量(X)和因变量(Y)之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。线性回归曲线回归Y随X的增加而增大且呈直线趋势。?0 0,表示直线与纵轴的交点在原点的上方?0 0,则交点在原点的下方?0 = 0,则回归直线通过原点 ?10,直线从左下方走向右上方,Y 随 X 增大而增大; ?10,直线从左上方走向右下方,Y 随 X 增大而减小; ?1=0,表示直线与 X 轴平行,X 与Y 无直线关系?1的统计学意义是: x每增加(减)一个单位,Y 平均改变?1个单位 残差(residual),即实测值Y与假定回归线上的估计值Yhat的纵向距离。求直线原理:最小二乘法求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。最小二乘法可保证各实测点至直线的纵向距离的平方和最小例一:x平均=2.5;Y平均=55.83 b1分子=364.5b1分母=17.5 b1=20.8b0=3

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档