- 1
- 0
- 约3.06千字
- 约 42页
- 2024-02-01 发布于江西
- 举报
..多元线性回归内容基础概念一元线性回归一元回归方程、线性回归条件步骤强影响点判断多元线性回归1、回归方程、线性回归条件2、线性回归步骤3、评价方程的优度4、强影响点判断5、多重共线性的判断基础概念回归什么是回归?变量间存在相关关系时,也就具备了建立预测关系的基础。在相关变量见建立预测方程式的统计学方法叫做回归分析。在问卷调查中用得多包括线性和非线性、一元和多元回归分析一元和多元线性回归一元线性回归:在两个变量具有线性关系的基础上,建立预测方程式。用一个变量预测另一个变量。如儿童的身高和体重存在线性相关,当得知身高时,预测被试的体重范围。多元线性回归:多个变量都与一个变量存在相关关系,建立用预测方程式。用多个变量预测某一个变量。例如:儿童的体重和年龄,都与身高存在线性关系,当已知体重和年龄时,对身高进行预测。一元和多元线性回归的差别在于自变量的个数一元线性回归一元线性回归方程(使用原始数据计算的回归方程)Y是因变量,X是自变量,alpha和beta是待求的参数。β=(δy/δx)*r,称为非标准化回归系数α=μy-βμx标准化回归方程(使用标准化的数据计算的回归方程)ZY=BZxB=(δZy/δZx)*r=1*r=r,称为标准化回归系数两种方程表现形式回归分析的一般过程1、提出假设的回归模型,确定自变量和因变量。自变量是现实中容易测量的,而因变量是难测量的,如幸福感、自我效能感等2、估计回归是线性还是非线性,用散点图判断。如果是线性则用线性回归。(必须做)3、建立回归方程4、回归方程的有效性检验,测定系数和回归系数一元线性回归的条件1、线性趋势(用散点图检测)2、独立性:因变量y的取值相互独立,残差独立。用durbin-watson计算,值在0-4。如果残差间相互独立,则取值在2附近。D小于2说明相邻误差存在负相关。大于2,说明存在正相关3、正态性:自变量的任何一个线性组合,因变量y都服从正态分布,残差正态(直方图和PP图)。4、方差齐性:自变量的任何一个线性组合,因变量y的方差均相同(把ZPRED放入Y轴,把ZRESID放入X轴做图)注意的问题强影响点判断(极端值的判断)Cook’sdistance:当值1,表明是特别大的极端值。leverage值(杠杆值):当值3倍均数,均数为(自变量个数+1)/N画散点图:最后把cook距离值和leverage杠杆值分别作为X和Y轴画散点图,方便判断。强影响点处理判断原因,考虑是否删除一元线性回归例子建立体重和肺活量的回归方程(用练习1的数据)一元线性回归步骤先探索数据,判断是否整态、极端值画散点图(画出散点图后,双击图,右键选addfitlineattotaltool)Analyze-regression-把肺活量放入因变量dependent-体重放入自变量independentStatistics-默认的-residuals-durinwastonsave——distance–勾上Cook’s和leverage值Plots-histogram和normalprobabilityplot勾上-把ZPRED放入Y,把ZRESID放入X轴——OKβ=(δy/δx)*r=(0.41989/7.426)*0.881=0.04981α=μy-βμx=3.1027-0.04981*53.43=0.441原始回归方程Y=0.0498X+0.441标准化回归方程Zy=0.881Zx测定系数判断因变量Y是独立的回归方程的显著性检验回归方程的系数、标准化回归系数、回归系数的显著性检验决定系数决定系数R2值域在[0,1],越接近于1,表明方程的自变量对y的解释能力越强。当变量的关系是线性关系时,R2越大,说明回归方程拟合数据越好,共变越多。校正的决定系数:随着自变量的增加,R2自然就会随之增加。所以R2是一个受自变量个数与样本规模影响的系数,一般的常规是1:10为好。当这个比例小于1:5时,R2倾向于高估实际的拟合优度。为了避免这种情形,常用校正的R2代替。回归方程显著:说明X与Y有显著的线性关系。用该方程表示X与Y之间的关系是可靠的。如果不显著,则不能用回归方程表示X与Y之间的关系。残差的正态性对比直方图和正态曲线的相似性,是否是中间高,两头低。P-P图的点是不是接近对角线。残差齐性多元回归偏回归系数:当其他变量不变时,xi每改变一个单位,所预测的y的平均变化量。受到自变量的单位影响。因此可以用标准化回归系数。标准化偏回归系数:可以用来比较哪个自变量是影响y
您可能关注的文档
- 轴承机床课程设计PPT课件.pptx
- 车间劳动纪律.doc
- 超高层建筑施工技术探讨.ppt
- 英汉习语与民俗及翻译PPT课件.ppt
- 直肠肛管周围脓肿-.ppt
- 2018版—毛概第八章(最新)PPT课件.ppt
- 智力宝宝快乐识字(B).ppt
- (潘鹏)情境领导力.ppt
- 清单11 记叙文阅读之朗读设计 表达技巧 主旨情感 开放探究(知识 方法 能力清单)(原卷版)-2026年中考语文二轮复习讲练(全国通用).docx
- 热点11 《中华人民共和国治安管理处罚法》(热点专练)(解析版)(全国通用) 2026年中考道德与法治一轮复习讲练.docx
- 散文题型03 理解分析词句(题型专练)(全国通用)(解析版)-2026年高考语文二轮复习讲练.docx
- 考前押题10 阅读理解之应用文——关注生活 学以致用(原卷版)(押题训练)2026年高考英语阅读理解突破策略及押题(全国通用).docx
- 清单04 综合性学习之语言表达(仿写邀请转述劝说) 活动策划(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单09 古诗文对比阅读之内容 情感 写法对比 语言 炼字 拓展探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 小说易错02 重点情节理解偏差(选择题)(易错专练)(全国通用)(原卷版)-2026年高考语文二轮复习讲练.docx
- 专题01 声现象(题型专练)(全国通用)(原卷版)2026年中考物理二轮复习讲练.docx
- 清单08 文言文(议论类 书信应用类)阅读之论点把握 文体特点(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单11 记叙文阅读之朗读设计 表达技巧 主旨情感 开放探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 语言清单05 语法填空中的词类(五)无提示词--连词(全国通用)(原卷版)2026年高考英语二轮复习讲练.docx
- 第04讲 想象探索与科学精神(《西游记》《海底两万里》《昆虫记》全国通用(讲义)(解析版)2026年中考语文一轮复习讲练.docx
原创力文档

文档评论(0)