多元线性回归分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三十页,共54页 3、剩余标准差 第三十一页,共54页 4、校正决定系数 第三十二页,共54页 三、逐步回归分析 第三十三页,共54页 (一)最优子集回归法 求出所有自变量可能组合子集的回归方程的模型(共有2m-1个),按一定准则选择最优模型,常用的准则有: ①校正决定系数(考虑了自变量的个数) ②Cp准则(C即criterion,p为所选模型中变量的个数;Cp接近p+1的模型为最优) ③AIC(Akaike`s Information Criterion)准则;AIC 越小越好 第三十四页,共54页 最优子集法的局限性 如果自变量个数为4,则所有的回归有24-1=15个;当自变量数个数为10时,所有可能的回归为 210-1= 1023个;……..;当自变量数个数为50时,所有可能的回归为250-1≈1015个。 第三十五页,共54页 (二)逐步选择法 1. 前进法(forward selection) 2. 后退法(backward elimination) 3. 逐步回归法(stepwise regression)。 它们的共同特点是每一步只引入或剔除一个自变量。决定其取舍则基于对偏回归平方和的F检验 第三十六页,共54页 (1)前进法 自变量从无到有、从少到多 Y对每一个自变量作直线回归,对回归平方和最大的自变量作F 检验,有意义(P小)则引入。 在此基础上,计算其它自变量的偏回归平方和,选取偏回归平方和最大者作F 检验,…。 局限性:后续变量的引入可能会使先进入方程的自变量变得不重要。 第三十七页,共54页 (2)后退法 先将全部自变量放入方程,然后逐步剔除 偏回归平方和最小的变量,作F检验及相应的P值,决定它是否剔除(P大) 。 建立新的回归方程。重复上述过程。 局限性:自变量高度相关时,可能得不出正确的结果;开始时剔除的变量即使后来变得有显著性也不能再进入方程 。 第三十八页,共54页 第一页,共54页 人的体重与身高、胸围 血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂 射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径与辐射的温度、 照射的时间 一个变量的变化直接与另一组变量的变化有关: 如: 第二页,共54页 Multivariate linear regression 概念: 多元线性回归分析也称复线性回归分析(multiple linear regression analysis),它研究一组自变量如何直接影响一个因变量。 自变量(independent variable)是指独立自由变量的变量,用向量X表示;因变量(dependent variable)是指非独立的、受其它变量影响的变量,用向量Y表示;由于模型仅涉及一个因变量,所以多元线性回归分析也称单变量线性回归分析(univariate linear regression analysis) 第三页,共54页 多元回归分析数据格式 第四页,共54页 假定因变量Y与自变量 间存在如下关系: 式中, 是常数项, 称为偏回归系数(partial regression coefficient)。 的含义为在其它自变量保持不变的条件下,自变量 改变一个单位时因变量Y 的平均改变量。 为随机误差,又称残差(residual),它表示 的变化中不能由自变量 解释的部分。 一、多元线性回归方程模型 第五页,共54页 x1 x2 y 第六页,共54页 应用条件: 注意:虽然模型要求因变量是连续数值变量,但对自变量的类型不限。若自变量是分类变量,特别是无序分类变量,要转化为亚变量才能分析。对于自变量是分类变量的情形,需要用广义线性回归模型分析。 第七页,共54页 二、多元线性回归分析的步骤 (一)估计各项参数,建立多元线性回归方程模型 (二)对整个模型进行假设检验,模型有意义的前提下,再分别对各偏回归系数进行假设检验。 (三)计算相应指标,对模型的拟合效果进行评价。 第八页,共54页 (一)模型的参数估计 第九页,共54页 27名糖尿病患者的血清总胆固醇(x1)、甘油三酯(x2)、空腹胰岛素(x3)、糖化血红蛋白(x4)、空腹血糖(y)的测量值列于表中,试建立血糖与其它几项指标关系的多元线性回归方程。 例14.1 第十页,共54页 各变量的离差矩阵 第十一页,共54页 线性回归方程模型

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档