- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学Ch15-王一任PPT
第十五章 多元线性回归分析; 讲述内容
第一节 多元线性回归
第二节 自变量选择方法
第三节 多元线性回归的应用
及其注意事项;目的:作出以多个自变量估计应变量的多元线性回归方程。
资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少数定性或等级指标需作转换。
用途:解释和预报。
意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。;第一节?? 多元线性回归;变量:应变量 1 个,自变量m 个,共 m+1 个。
样本含量:n
数据格式见表15-1
回归模型一般形式:;一般步骤; 二、多元线性回归方程的建立
;表15-2 27名糖尿病人的血糖及有关变量的测量结果 ;求偏导数;三、假设检验及其评价 ;表15-4 例15-1的方差分析表 ;2. 决定系数R 2:;3.复相关系数 ;(二)对各自变量 指明方程中的每一个自变量对Y的影响(而方差分析和决定系数检验整体)。;;表15-5 对例15-1数据作回归分析的部分中间结果 ;结
果;结 论;2. t 检验法 是一种与偏回归平方和检验完全等价的一种方法。计算公式为;结 果;3.标准化回归系数 变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。;注意:
一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其他自变量保持不变时, 增加或减少一个单位时Y的平均变化量 。不能用各 来比较各 对 的影响大小。
标准化回归系数无单位,用来比较各自变量对应变量的影响大小, 越大, 对
的影响越大。;结
论;第二节????自变量选择方法 ;一、全局择优法;;;;例15-2 用全局择优法对例15-1数据的自变量进行选择。 ;二、逐步选择法;选择方法:;;表15-7 逐步回归过程 ;表15-8 例15-3方差分析表 ;表15-9 例15-3的回归系数的估计及检验结果 ;第三节; 一、多元线性回归的应用;二、多元线性回归应用的注意事项;数据格式回归方程 ;;b1,b2,b3分别反映中学、大学、大学以上相对于小学文化程度者经济收入差别的大小; 2.样本含量: n =(5???10)m。
3.关于逐步回归: 对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。例如,例15-3中若将选入标准和剔除标准定为 和 ,选入的变量是 ,而不是 ,结果发生了改变。
不同回归方程适应于不同用途,依专业知识定。;4. 多重共线性 即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果:
(1)参数估计值的标准误变得很大,从而t值变得很小。
(2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。
(3)t检验不准确,误将应保留在模型中的重要变量舍弃。
(4)估计值的正负符号与客观实际不一致。;;;谢谢大家!
文档评论(0)