- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲多元线性回归分析 作者 : 丁海龙单位 : 中国医科大学第一节 多元线性回归第二节 自变量选择方法第三节 多元线性回归的应用及其注意事项重点难点掌握多元线性回归模型的表达以及应用条件,能够对统计软件给出的结果分析变量的作用。熟悉多元变量选择的三种方法及正确应用,以及对多元线性回归模型的拟合效果进行评价。了解多元线性回归的主要应用及其注意事项。第一节多元线性回归医学统计学(第4版)问题提出多元线性回归(multiple linear regression analysis):研究一个因变量与多个自变量之间线性依存关系的统计方法。X1YeXm…例如:儿童的身高与年龄、性别;肺活量与年龄、性别、身高、体重、胸围的呼吸差;糖尿病病人的血糖与胰岛素、生长素;糖尿病患者的糖化血红蛋白与年龄、体重指数、总胆固醇、收缩压及舒张压等。多元线性回归方程数据格式一、多元线性回归方程多元线性回归模型误差上述多元线性模型可简写成回归方程的形式:?为在自变量 时,因变量的总体平均值的估计值;是常数项,表示当所有自变量为0时因变量 Y 的总体平均值的估计值;为自变量 的偏回归系数(partial regression coefficient) 的估计值,简称回归系数,表示除 以外的其它自变量固定不变的情况下, 每改变一个测量单位所引起的因变量的平均改变量。模型的假定条件?(与 之间具有线性关系;(2)各例观测值 相互独立;(3)残差 服从均数为0,方差为 的正态分布, 它等价于对任意一组自变量值,因变量具有相同方差,并且服从正态分布。多元线性模型:二、多元线性回归方程的建立参数估计-最小二乘法?使各散点到直线的纵向距离的平方和最小计算出使最小的,再计算常数项 b0= -(b11+b22+……+bmm)多元线性回归方程的最小二乘法计算量较大,常需要借助统计软件完成。实例例15-1 227名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。27名糖尿病人的血糖及有关变量的测量结果序号i总胆固醇甘油三脂胰岛素糖化血血糖(mmol/L)(mmol/L)(μU/ml)红蛋白(%)(mmol/L)X1X2X3X4Y15.681.904.538.211.223.791.647.326.98.836.023.566.9510.812.344.851.075.888.311.654.602.324.057.513.466.050.641.4213.618.374.908.5012.608.511.1例15-1 SPSS演示选择因变量选择变量筛选方法选择自变量回归系数95%可信区间SPSS结果显示-模型描述SPSS结果显示-方差分析SPSS结果显示-回归系数b1=0.1424,b2=0.3515, b3=-0.2706,b4=0.6382,b0=5.9433所求多元线性回归方程为:由上面的方程可以看出:总胆固醇、甘油三酯和糖化血红蛋白的升高会引起血糖的升高,而胰岛素的升高会引起血糖的下降。三 、 多元线性回归方程的假设检验及其评价将回归方程所有自变量作为一个整体来检验它们与应变量之间是否具有线性关系(方差分析法、复相关系数);对回归方程的预测或解释能力作出综合评价(决定系数,校正决定系数);在此基础上进一步对各个自变量的重要性作出评价(偏回归平方和、t 检验、标准化回归系数)。(一)回归方程的假设检验及评价1.方差分析法-因变量总离均差平方和?-反映由于方程中个自变量与因变量的线性关系而使因变量 变异减少的部分??-反映除自变量外,其他随机因素对 Y 变异的影响图示 回归分析中总变异的分解总变异中的离均差平方和自由度都可以被分解为两部分图示 不同自由度的F分布的概率密度曲线?无效假设:成立条件下统计量服从 分布,如果 ,则在 水平上拒绝,认为个自变量中至少有一个与因变量 之间存在线性回归关系,即回归方程有统计学意义;否则,不拒绝 ,即回归方程无统计学意义。原理:方差分析法可以将回归方程中的所有变量作为一个整体来检验它们和应变量之间是否具有线性关系。建立检验假设:SPSS结果显示-方差分析按 0.05水准, 拒绝H0 , 接受H1,认为应变量Y与4个自变量之间存在线性回归关系。2. 决定系数R2说明自变量能够解释Y变化的百分比。其值越接近于1,说明模型对数据的拟和效果越好。3. 复相关系数(multiple correlation coefficient)可以用来度量应变量Y 和多个自变量之间的线性相关程度。如果只有一个自变量时,(二)偏回归系数检验回归方程成立,只能说明整体情况下自变量与因变量之间存在线性关系,但并不能保证每一个自变量都与因变量之间存在线性关
原创力文档


文档评论(0)