回归(一)概览.ppt

libname ycr D:\test; data ycr.power_speednew; set ycr.power_speed; speedsq speed*speed; run; proc reg data ycr.power_speednew; model power speed speedsq/r; run; 在原来的数据集中加入一个新的变量speedsq speed*speed 二次曲线拟合(程序) 回归曲线拟合好坏的度量 一. 判定系数 R-Square : 回归平方和占总平方和的比例 越接近1,回归方程的拟合程度越好 二.估计标准误差(剩余标准差Root MSE) 估计标准误差越小,说明模型对数据的拟合效果越好 比较线性模型和二次曲线模型拟合的程度 线性模型 二次曲线模型 6.2.5 变量选择 影响因变量Y的因素有很多,“最优”的回归方程中应该包括那些有显著影响的自变量,剔除掉影响不显著的因素。 也就是要从自变量集 中选出一个子集 ,使得建立的回归方程中,仅包含有显著影响的自变量。 “最优”选择的标准 教材第85页给出了5个评判函数:都是误差项平方和ESS A 的函数。评判函数的值越小,模型就越接近“最优”。 选变量? 向前引入法 向后剔除法 逐步筛选法 向前引入法 假设有m个自变量 1.引入一个自变量,将得到m个一元线性模型。m个模型中,p值最小的那个模型包含

文档评论(0)

1亿VIP精品文档

相关文档