- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《管理统计学》第八章相关分析与回归分析1
124 Note: 1. As we move farther from the mean, the bands get wider. 2. The prediction interval bands are wider. Why? (extra Syx) 139 24 This teleology is based on the number of explanatory variables nature of relationship between X Y. 有影响的观测值 如果某一个或某一些观测值对回归的结果有强烈的影响,那么该观测值或这些观测值就是有影响的观测值 一个有影响的观测值可能是 一个异常值,即有一个的值远远偏离了散点图中的趋势线 对应一个远离自变量平均值的观测值 或者是这二者组合而形成的观测值, 有影响的观测值(图示) 不存在影响值的趋势 不存在影响值的趋势 存在影响值的趋势 杠杆率点(leverage point) 如果自变量存在一个极端值,该观测值则称为高杠杆率点(high leverage point) 在一元回归中,第i个观测值的杠杆率用hi表示,其计算公式为 如果一个观测值的杠杆率 就可以将该观测值识别为有高杠杆率的点 SPSS:杠杆值(Leverage values)。该值大于2*p/n,时认为该点为强影响点。P为解释变量个数,n为样本量。 一个有高杠杆率的观测值未必是一个有影响的观测值,它可能对回归直线的斜率没有什么影响 高杠杆率点 (图示) 高杠杆率点 8.6 曲线回归 曲线回归的处理思路 指数曲线回归方程 高次曲线回归方程 曲线回归思路 通常将曲线采用变量代换的方法将非线性模型转化为线性,再用线性方法处理 指数曲线的回归 指数的回归模型方程 作对数变换 参数求解方程组: 高次方程的回归 指数的回归模型方程 指数回归方程(例题分析) 企业 编号 月产量(吨) x 单位产品成本(元) y 企业 编号 月产量(吨) x 单位产品成本(元) y 1 2 3 4 5 6 10 16 20 25 31 36 160 151 114 128 85 91 7 8 9 10 11 12 40 45 51 56 60 65 75 76 66 60 61 60 【例】 12个同类企业月产量和单位产品成本 指数回归方程(例题分析) 绘制散点图,并可用软件进行曲线拟合 指数回归方程(例题分析) 从散点图看,适用于配合指数曲线回归方程 作对数变换 指数曲线转变为直线: 参数求解方程组: 指数回归方程(例题分析) 根据例题资料计算得 代入参数方程组得 解得 对A、B取反对数得 指数曲线的回归方程为 本章小结 变量间关系的度量 回归模型、回归方程与估计的回归方程 回归分析中的判定系数 回归直线的估计标准误差 估计和预测 曲线回归到处理 结 束 SPSS多元线性回归 自相关系数 自相关系数的取值范围在-1~+1之间。接近于1表明序列存在正自相关;接近于-1表明序列存在负自相关。 DW(Durbin-Watson)检验 当DW=4(ρ=-1)时,残差序列存在完全负自相关; 当DW=0(ρ=1)时,残差序列完全自相关。 当DW=(2,4),(ρ=(-1,0)之间),残差序列存在负自相关; 当DW= (0,2),(ρ=(0,+1)之间),残差序列存在正自相关; 当DW=2(ρ=0)时,残差序列无自相关; 其中:ρ为自相关系数 DW检验是推断小样本序列是否存在一阶自相关的统计检验方法 DW≈2(1-ρ),| ρ |≤1,所以DW=0~4。 SPSS中强影响点的判断 Influence statistics:用于判断强影响点的统计量: DfBeta(s): Difference in Bate的缩写,表示去除该观测值后回归系数的变化值; Standardized DfBeta:标准化DFBeta值,它大于2/Sqrt(n)时,该点可能是强影响点。Sqrt()为平方根,n为样本量; DFFit:Difference in fit value的缩写,表示去除该值观测值后测量值的变换值; Standardized DfFit:标准化DfFit值,它大于2/Sqrt(p/n)时,该点可能是强影响点。P为解释变量个数。 Covariance ratio:去除该观测值后,协方差阵与含全部观测值的协方差阵的比率。它的绝对值大于3*p/n时,该观察值可能时强影响点。 SPSS中强影响点的判断 Leverage values 库克距离:Cook’s:是杠杆值hi与残差ei大小的综合效应。一般Cook’s大于1,认为该观测值为强影响点。 P为解释变量个数。 回归系数的检验 (
文档评论(0)