- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多重线性回归流行病与卫生统计学系内 容多重线性回归回归分析中自变量的选择多因素线性回归的应用及注意事项复 习线性回归分析是研究一个变量和另外一些变量间线性关系的统计分析方法。 在回归分析中,最简单的情形是模型中只包含两个有“依存关系”的变量,一个变量(反应变量)随另一个变量(自变量)的变化而变化,且呈直线变化趋势,称之为简单线性回归。 给定X的数值, Y 的数值取在一个平均值 (?y|x)附近 对应于不同的X值, Y 的平均值座落在一条直线上 ---- 回归直线. ?y|x 和 X的关系可用一个线性方程描写.简单线性回归方程总体样本“Y hat”表示估计值,给定x时y的总体均数的估计值。直线回归方程的求解:最小二乘原理YX 找一条直线使残差平方和最小 利用微积分知识,容易得到 这条线一定过两个点 和 回归系数及其计算线性回归分析的前提条件线性(Linear)反应变量Y与自变量X呈线性变化趋势独立(Independent)任意两个观察值相互独立,一个个体的取值不受其他个体的影响给定X时,Y正态分布(Normal)给定X取值时,Y的取值服从正态分布等方差(Equal variance)指对应于不同的X值,Y值的总体变异相同直线回归应用条件LINE示意图回归方程有统计学意义吗 建立样本直线回归方程,只是完成了统计分析中两变量关系的统计描述,这种关系是否有统计学意义,还需要进一步进行假设检验。检验回归模型是否成立:方差分析检验总体回归系数β是否为零:t检验例1: 某研究者研究大气污染物一氧化氮(NO)的浓度(ppm)与汽车流量(千辆)、气温(℃)、空气湿度(%)、风速(m/s)等因素的关系,结果见表1: 单位时间内过往的汽车数(千辆)、气温(℃)、空气湿度(%)、风速(m/s)这四个因素是否都对空气中一氧化氮(NO)的浓度(ppm)有影响?如何定量地描述这些因素对一氧化氮浓度的影响?哪个因素对一氧化氮浓度的影响最大?哪个因素的影响最小?如果利用这些影响因素去预测空气中一氧化氮的浓度,如何预测?效果如何? 第一节 多重线性回归概 念多重线性回归(multiple linear regression)因变量: 一个, Y自变量: 多个, X1, X2, X3, … , Xp方程:多元线性回归(multi- variate linear regression)简称多元回归(multi- variate regression):因变量: 多个, Y1,Y2 , …自变量: 多个, X1, X2, X3, …方程:多重线性回归方程多重线性回归方程是简单线性回归方程的扩展其中 表示当所有自变量为0时反应变量Y的总体平均值。 为变量Xi 的总体偏回归系数(partial regression coefficient),表示当方程中其他自变量保持常量时,自变量Xi每增加(或减少)一个计量单位,反应变量Y平均变化 个单位。样本回归方程 反应变量Y的总体平均值的估计值。 b0为常数项,又称为截距,是总体参数的估计。 bi为自变量Xi 的偏回归系数,是总体参数 的估计值。如果要建立由车流量( )和风速( )预测一氧化氮浓度(Y)的线性回归方程,模型可以写成: 表示在车流量不变的情况下,风速每增加一个单位(1m/s),估计空气中一氧化氮的浓度平均改变个单位(ppm)。表13-1 多重线性回归分析数据格式 前提条件(LINE)多重线性回归分析步骤求回归方程 ----- 最小二乘原则假设检验 ----- 检验回归方程是否具有统计学意义,模型有意义的前提下,再分别对各偏回归系数进行假设检验。(3)变量选择 ----- 以尽量少的自变量, 达到较好地解释Y的目的回归系数的估计,求回归方程 采用最小二乘法 (least squared method)来估计偏回归系数 基本原理:寻找一套适宜的偏回归系数( ),建立多重线性回归方程,使得反应变量的观测值 与回归方程的估计值之间的残差平方和最小。 SPSS实现方法:Analyze---Regression---Linear--- y选入Dependent x1、x2、X3...XP选入Independent Method--- Enter Stepwise Backward Forward ---ok考虑:当建立样本回归方程后,首先要考察这个回归方程是否有意义?即在, , , , 中,是否至少存在一个自变量与Y的总体均数呈线性关系?回归方程的效果如何?也即是这四个自变量能够解释反应变量的变异的百分比是多少?四个自变量是否都对反应变量有影响?即各个偏回归系数( )所对应的总体偏回归系数( )是否等于0?统计推断这
原创力文档


文档评论(0)