9 第九章 回归与相关.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
9 第九章 回归与相关

第九章 双变量回归与相关   医学科学研究中,常要分析变量间的关系,如年龄与血压、药物剂量和动物死亡率、环境介质中污染物浓度与污染源距离等,回归与相关就是研究这种关系的统计方法,属于双变量分析范畴。 第一节 直线回归 一、直线回归的概念    为直观地说明直线回归的概念,我们以8名儿童的年龄(岁)与其尿肌酐含量(mmol/24h)数据绘图,得图9-1 二、直线回归方程的求法 直线方程为: a为Y轴上的截距;b为斜率,表示X每改变一个单位,Y的变化的值,称为回归系数; 表示在X值处Y的总体均数估计值。为求a和b两系数,根据数学上的最小二乘法原理,可导出a和b的算式如下:   三、直线回归中的统计推断 一)回归方程的假设检验  1、方差分析    前面所求得的回归方程是否成立,即X、Y是否 有直线关系,是回归分析要考虑的首要问题。我们知道即使X、Y的总体回归系数?为零,由于抽样误差,其样本回归系数b也不一定为零。因此需作? 是否为零的假设检验,用方差分析或t检验。在讲述假设检验之前,我们先对就应变量Y的离均差平方和lYY作一分析。 lYY的分析 如图9-4,p点的纵坐标被回归直线与均数截成三个线段: 二)、总体回归系数的区间估计 例9-3 试用例9-1所计算的样本回归系数b=0.1392,估计总体回归系数的?95%的可信区间:Sb=0.0304, (三)利用回归方程进行估计和预测 1、总体均数 的估计 总体中当X为某一定值X0的条件下Y的均数。 图9-5 总体均数 的可信区间和个体Y值的预测区间示意图 例9-4 用例9-1所得直线回归方程,计算当X0=12时, 的95%可信区间和相应个体Y值的95%可信区间和相应个体Y值的95%预测区间。 第二节 直线相关 一、直线相关的概念 直线相关又称简单相关,用于双变量正态分布资料。 第二节 直线相关 二、相关系数的意义与计算 它又称为积差相关系数,以符号r 来表示相关系数。 它是说明两变量间相关关系的密切程度和相关方向。 三、相关系数的统计推断 一)相关系数的假设检验 r是样本相关系数,它是总体相关系数?的估计值。要判断X、Y间是否有相关关系,就要检验r是否来自总体相关系数?为零的总体。检验统计量为: 二)、总体相关系数?的区间估计 例10.10 前面已求出正常儿童年龄与尿肌酐的r=0.8818,求总体相关系数的95%可信区间。 将Z作反变换,得正常儿童年龄与尿肌酐的总体相关系数可信区间为(0.4678—0.99971) 四、决定系数 直线回归与相关中还有一个重要的统计量称为决定系数(cofficient of determnation),定义为回归平方和与总平方和之比,计算公式为: 决定系数除了作为相关或回归拟合效果的概括统计量,还可利用它对回归或相关作假设检验: 五、直线回归与相关应用注意事项 1、根据分析目的选择变量及统计方法 无论是相关还是回归,两个变量的选择一定要结合专业背景,把毫无关联的两种现象作回归与相关 2、进行相关与回归分析前应绘散点图 两变量之间可能的关系除了从专业角度考虑,对现有的数据来说散点图是很重要的提示。 3、用残差图考察是否符合模型假设条件 对线性回归模型通常采用最小二乘法来估计回归系数,并在此基础上作进一步推断。 4、结果的解释及插正确解释 反应两变量关系的密切程度或数量上影响大小的统计量应是相关系数和回归系数,而不是P值。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围,此时求得的预测值称为内插法,而超出自变量的范围所得预测值称为外延,若无充分理由说明现有自变量范围以外两变量仍然是直线关系,应尽量避免不合理的外延 5、 直线回归与相关的区别和联系 一、区别 1.资料要求不同 2.应用情况不同 二、联系 1.r和b正负号一致 2.假设检验等价,对于同一资料tr=tb,由于r的假设检验可用查表,而b检验计算较繁,故在实际应用上常用前法代替后法。 3.用回归解释相关 第三节 秩相关 秩相关,又称为等级相关,适用于下列资料(1)不服从双变量正态分布不宜作积差相关(2)总体分布型未知或开口资料(3)用等级表示的原始 例9-8 某省调查了1995年到1999年当地居民18类死因的构成以及每种死因导致的潜在工作损失年数WYPLL的构成,结果见表9-3。以死因构成为X,WYPLL构

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档