建立的样本回归方程.pptVIP

  • 42
  • 0
  • 约4.07千字
  • 约 45页
  • 2019-05-31 发布于天津
  • 举报
多元线性回归 Multiple Regression 卫生统计与信息管理教研室 二00七年九月 基本概念 例 以8岁正常男童的 体重 X1 心脏纵径 X2 儿童心脏面积Y 胸腔横径X3 推算 基本概念 例: 人的体重与身高、胸围 血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂 射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径与辐射的温度与照射的时间 基本概念 多元(重)线性回归方程 描述2个或2个以上自变量Xi与1个应变量Y的统计关系的线性方程。 自变量阶数为1的多元线性回归方程被称为一阶线性回归方程。 Y(hat)=b0+b1x1+b2 x2 +…+bmxm 基本内容 从具有n个样品的m个自变量与1个应变量的样本观测数据出发,建立Xi与Y关系的线性回归方程表达式; Y(hat)=b0+b1x1+b2 x2 +…+bmxm 对所建立的多元线性回归方程进行假设检验: 各βi(i=1 2 ….m)不全等于0 ; 对每一变量进行假设检验: H0:某一βJ不等于0 ; 应用:描述、预报与控制。 多元回归分析所要求的条件 LINE 样本量要求:一般样本含量要求是参与分析的变量(自变量+因变量)个数的5~10倍,对多元线性回归甚至要求20倍(粗略估计)。 数据准备---数据格式 数据准备----随机缺失的处理 不完全数据样品:1个样品中有一个或几个变量值缺失。“缺失”分为非随机缺失、随机缺失。 随机缺失的处理 样本含量大,不完全数据样品小,删除该样品; 样本含量小,需利用不完全数据样品 ※ 用该变量的均数值代替; ※ 缺失值变量与其他变量相关程度大,则建立该缺失 变量与其他变量的回归方程,据此推算缺失值; ※ 其他处理办法 数据准备----量化 定量资料是否需要进行转换? 定性资料数量化 回归模型 μY|x1, x2…xm= β0+β1x1+ β2 x2 +…+ βmxm β0:常数项,截距,指当所有自变量X1、X2、…Xm均为0时,应变量Y的总体平均值μY Βj(j=1,2,…,m) :自变量Xj的总体偏回归系数,表示在其他自变量保持不变时,自变量Xj每增加(或减少)一个计量单位,应变量Y平均变化Βj个单位 回归方程 从样本数据出发,建立的样本回归方程 Y(hat)=b0+b1x1+b2 x2 +…+bmxm Y(hat): μY|x1, x2…xm的估计值 b0 ,b1,b2,…..,bm:参数β0 ,β1, … ,βm的估计值,即常数项和偏回归系数 回归方程的建立 参数估计原理 根据最小二乘法原理,通过对微分方程组求偏导数,解出常数项b0 (或待定系数)和偏回归系数b1,b2…..bm。 最小二乘法原理 使得实际观察值Yi与回归方程 的估计值Y(hat)之间的残差平方和最小。 正规方程矩阵形式与解的矩阵形式 B=(X’X)-1 X’Y中 1 x11 x12 …x1m y1 b0 X= 1 x21 x22 …x2m Y= y2 B = b1 ……………… … … 1 xn1 xn2 …xnm ym bm 回归效果的检验 建立了回归方程后,需要进行假设性检验             整个模型的假设检验      各回归参数的假设检验 整个模型的假设检验 建立检验假设和备择假设 H0 : β1=…βm =0 , H1 : β1 ,…,βm不全为0 整个模型的假设检验 方差分析 整个模型的假设检验 判断结果 根据检验水平a,查F值表,Fa,若F≥Fa ,P a,则拒绝H0 ,可认为回归效果具有统计学意义,否则,接受H0 。 回归系数的假设检验 建立检验假设和备择假设 H0 : βj=0 , H1 : βj=0 回归系数的假设检验 t检验 其中,SY.12….m :剩余标准差 Cii =(X’X)-1

文档评论(0)

1亿VIP精品文档

相关文档