- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
多元线性回归的应用条件:
1.独立性:各观察对象间相互独立。2.线性:自变量与应变量间的关系为线性。3.正态性:自变量取不同值时,应变量的分布为正态。4.方差齐性:自变量取不同值时,应变量的总体方差相等。5.当不符合条件时,可对自变量进行变换。如:第30页,共49页,星期日,2025年,2月5日要比较各个自变量对于应变量的作用大小,不能用偏回归系数,因为各偏回归系数的单位不同。必须把偏回归系数标准化,化成没有单位的标准偏回归系数.消除不同单位的影响后,标准偏回归系数的绝对值越大,该自变量对于应变量的作用越大,但该差别是否有统计意义,也必须经过检验。第31页,共49页,星期日,2025年,2月5日(2)对各偏回归系数的显著性检验:F检验与t检验1.计算截距和各偏回归系数。2.多元回归方程的显著性检验:(1)整个方程的显著性检验:用方差分析。第32页,共49页,星期日,2025年,2月5日STEPWISEREGRESSION一.逐步回归分析的基本概念逐步回归分析的目的是建立“最优”回归方程。“最优”回归方程是指包含所有对y有显著作用的自变量,而不包含对y作用不显著的自变量的方程。第33页,共49页,星期日,2025年,2月5日逐步回归分析的计算方法
在供选的自变量Xi中,按其对y的作用大小,由大到小地把自变量逐个引入方程,每引入一个自变量就对它作显著性检验,显著时才引入,而当新的自变量进入方程后,对方程中原有的自变量也要作检验,并把作用最小且退化为不显著的自变量逐个剔出方程。因此,逐步回归的每一步(引入一个变量或剔除一个变量都称为一步)前后都要作显著性检验,以保证每次引入新变量前方程中只包含作用显著的自变量。这样一步步进行下去,直至方程中所含自变量都显著而又没有新的作用显著的自变量可引入方程为止。第34页,共49页,星期日,2025年,2月5日逐步回归分析在医学研究中的应用及需要注意的几个问题1方程“最优”问题,实际是精选自变量以求得拟和效果最好的多元回归方程。最优子集回归是选择一种使回归方程拟和最好的自变量,而逐步回归则选择对因变量作用有意义的自变量。要根据研究目的选用适合方法。2逐步回归主要在医学中用于病因探索,临床疗效分析及控制等。3线性回归模型要注意正态性,方差齐性和独立性,因变量必须是随机变量等。4入选变量如果明显地与实际问题的专业理论不一致时,首先检查数据是否有异常点,自变量间有无共线性存在,数据输入是否有误等,要结合专业知识作出合理的解释。5逐步回归在对大量因素进行分析时,可以先进行聚类分析,然后进行逐步回归。通常,观察单位取变量值的5~10倍为宜。第35页,共49页,星期日,2025年,2月5日统计方法的分类与选择第1页,共49页,星期日,2025年,2月5日根据研究设计类型选择分析方法第2页,共49页,星期日,2025年,2月5日(一)、成组比较的设计在成组比较设计中,若是两组比较需要应用t检验或X2检验。多组比较需应用方差分析、行×列表X2检验或分级的分析方法。第3页,共49页,星期日,2025年,2月5日(二)、配对(自身实验前后)设计这种类型的设计需要按照配比的t检验,X2检验及配对的病例对照研究方法进行数据分析。第4页,共49页,星期日,2025年,2月5日(三)、重复测量的设计这类设计方法是在给定一个处理因素后在不同的时间重复测量某一效应变量的改变情况。如欲评价生物制品接种后的免疫学效果,在接种后的2周、4周、6周和8周测定抗体滴度,即为此类设计类型。对于这种设计类型的数据需应用重复测量的方差分析方法进行数据的分析。第5页,共49页,星期日,2025年,2月5日(四)、多因素设计若在研究设计中有多个自变量,则可根据因变量的性质选择合适的多因素分析方法。如果自变量是数值变量,则可考虑应用多元回归分析方法、协方差分析方法。如果是分类变量,则可选择logistic回归分析方法、判别分析方法及聚类分析方法等。第6页,共49页,星期日,2025年,2月5日根据变量的类型选择分析方法第7页,共49页,星期日,2025年,2月5日区别与明确研究的因变量和自变量具有重要的流行病学与生物统计学意义,首先它有助于选择拟研究的变量,对调查表的设计具有指导作用。其次数据分析阶段可以指导数据分析方法的选择及模型的建立。若因变量是分类变量,则常考虑应用分类变量的分析方法,
文档评论(0)