- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
李国奇安贞医院多元线性回归(multiplelinearregression)
主要内容第一节:多元线性回归概念及统计描述第二节:多元线性回归假设检验第三节、多元线性回归自变量的筛选第四节:多元线性回归应用第五节:多元线性回归应注意问题第六节:实例分析(SAS)
logo多元线性回归概念及统计描述概念:用于分析一个连续型因变量与多个自变量之间的线性关系的统计学分析方法。例:血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂
多元线性回归数据结构假定对n例观察对象逐一测定了因变量Y与m个自变量X1,X2,…Xm的数值。━━━━━━━━━━━━━━━━━━━━━━例号X1X2…XmY─────────────────────X11X12…X1mY1X21X22…X2mY2┆┆…┆┆nXn1Xn2…XnmYn━━━━━━━━━━━━━━━━━━━━━━
多元线性回归模型多元线性回归数学模型:相应的由样本估计而得到的回归模型:其中?表示Y的总体平均值的估计值,b0为常数项,也称为截距,bi为Xi的偏回归系数,表示当方程中其他自变量不变时,自变量Xi变化一个计量单位,反应变量Y的总体平均值的估计值变化的单位数.
标准化偏回归系数因为各自变量都有各自的计量单位以及不同的变异度,所以不能直接用普通偏回归系数的大小来比较方程中各个自变量对反应变量Y的影响大小。需要求出标准化偏回归系数。设:与一般回归系数bi对应的标准化偏回归系数为Bi,则SXi、SY分别为Xi和Y的标准差。
偏回归系数的估计--最小二乘法基本思想:利用收集到的因变量和自变量建立线性函数,使得每一个实际测量的Yi与估计的Yi之间的离差的平方和尽可能的小。只有一个自变量时,回归结果为二维平面的一条直线,而有两个自变量时,结果为三维空间的一个平面,有更多的自变量时,回归的结果则是在三维以上空间的“超平面”,无法直观图形表达,只能想象。
多元线性回归分析前体条件——LINElinear:Y与X1,X2,…,Xm之间具有线性关系。independent:各个体观测值间相互独立。normaldistribution:在一定范围内,对任意一组自变量X1,X2,…,Xm值,Y都服从正态分布。equalvariance:在一定范围内,不同组自变量对应的Y具有相同方差。
残差分析通过残差分析可以深入了解实际资料是否符合回归模型假设(如正态、方差齐)
多元线性回归决定系数决定系数:回归平方和(SS回)在总平方和(SS总)中比例。R2=SS回/SS总0≤R2≤1,R2接近1,表示样本数据很好的拟合了所用的线性回归模型。R2反映了线性回归模型能多大程度上解释Y的变异。
第二节:多元线性回归假设检验在多元线性回归模型中,由于变量众多,需要对模型的合理性以及参数的显著性进行检验。回归方程的假设检验(F检验)H0:β1=β2=…=βp=0H1:β1,β2…βp不全为0如果H0成立,认为回归方程不显著,如果拒绝H0,认为回归方程显著。
回归系数的假设检验(t检验)在F检验中,如果拒绝H0假设,只能说β1,β2…βp不全为0,还需要进一步检查每个自变量的总体偏回归系数。H0:βi=0,H1:βi≠0(i=1,2…p)如果H0成立,认为偏回归系数βi不显著,如果拒绝H0,认为偏回归系数βi显著。
第三节、自变量的筛选多元回归分析时收集的某些自变量对因变量无影影响或影响甚微;也不敢保证自变量之间是相互独立的,因而在建立多元线性回归方程时,需要使回归方程尽可能包含对解释因变量有较大贡献的自变量,而把贡献不大的或无贡献以及与其他自变量有密切关系的自变量排除。
自变量筛选的标准和原则残差平方和(SS残)缩小或决定系数(R2)增大R2=1-SS残/SS总残差均方(MS残)缩小或调整决定系数(R2ad)增大MS残=SS残/(n-p-1)Cp统计量减小
自变量筛选的方法向前选择法建模时没有自变量,逐个加入自变量。并通过F检验加入自变量对模型的影响是否显著。显著则保留此变量。向后删除法建模时加入所有自变量,通过F检验,逐个剔除在当前模型中最不显著的自变量,直到模型的变量都显著为止。逐步筛选法为上述两种方法的综合,即每次首先加入一个变量,如果其对模型影
您可能关注的文档
最近下载
- 智慧课堂下高中数学定理课的教学设计研究.pdf VIP
- 徕卡DNA03/DNA10 数字水准仪说明书.docx VIP
- 牦牛标准化育肥场布局及圈舍建设规范.docx VIP
- 手术室护理不良事件管理.pptx
- 李脂肪栓塞综合征的护理.ppt
- BS EN IEC 62501-2024 Voltage sourced converter (VSC) valves for high-voltage direct current (HVDC) power transmission — Electrical testing 高压直流动力传输用电压源换流阀ー电气试验.pdf
- 2022年全国甲卷统一高考物理试卷(附答案).pdf VIP
- 个人简历——【标准模板】.doc VIP
- 行政人事管理成套个人简历Word模板(高端绿色).docx VIP
- 一般过去时知识点及练习.docx VIP
文档评论(0)