章双变量回归与相关.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
章双变量回归与相关.ppt

第九章; 例9-1 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。 ;;双变量计量资料: 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), …, (Xn,Yn) 每个个体有两个变量值 总体:无限或有限对变量值 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本——直线回归、直线相关;本章内容: 第一节 直线回归 第二节 直线相关 第三节 秩相关 第四节 加权直线回归(不讲) 第五节 两条回归直线的比较(不讲) 第六节 曲线拟合(简单介绍); ;第一节 直线回归;一、直线回归的概念 ; 例9-1 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。 ;;;;直线回归方程的一般表达式为 ;1.a 为回归直线在 Y 轴上的截距。;b0,直线从左下方走向右上方,Y 随 X 增大而增大; b0,直线从左上方走向右下方,Y 随 X 增大而减小; b=0,表示直线与 X 轴平行,X 与Y 无直线关系。; ;;二、直线回归方程的求法 ;; 例9-1 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。 ;解题步骤; 此直线必然通过点( , )且与纵坐标轴相交于截距 a 。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读数的 X 值代入回归方程得到一个点的坐标,连接此点与点( , )也可绘出回归直线。 ;;三、直线回归中的统计推断;(一)回归方程的假设检验 ;;1.方差分析 ;数理统计可证明: ;;上式用符号表示为 ;上述三个平方和,各有其相应的自由度 ,并有如下的关系: ; 如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量 F ;式中 ;2. t 检验; 例9-2 检验例9-1数据得到的直线回归方程是否成立? ;(1)方差分析; 表9-2 方差分析表 ;(2)t 检验;注意: ;(二)总体回归系数 的可信区间; 例9-3 根据例9-1中所得b=0.1392,估计其总体回归系数的双侧95%可信区间。 ;??0.1392-2.447×0.0304,0.1392+2.447×0.0304) =(0.0648,0.2136);(三)利用回归方程进行估计和预测 ;(9-15) ;;; 例9-4 用例9-1所得直线回归方程,计算当X0=12时, 的95%可信区间和相应个体值的95%预测区间。 ;计算步骤;第二节 直线相关; 直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布(bivariate normal distribution)资料。其性质可由图9-6散点图直观的说明。 目的:研究 两个变量X,Y数量上的依存(或相关) 关系。 特点:统计关系 (例如:14岁以下青少年的年龄与体重之间的关系);二、相关系数的意义与计算;;2. 计算:样本相关系数的计算公式为 ;由例9-1算得,;三、相关系数的统计推断; 例9-6 对例9-5所得 r 值,检验尿肌酐含量与年龄是否有直线相关关系? ;检验步骤;(二)总体相关系数的可信区间 ;具体步骤如下; 例9-7 对例9-5所得r值,估计总体相关系数的95%可信区间。 ;四、决定系数(coefficient of determination) ;五、直线回归与相关应用的注意事项 ; ;2.进行相关、回归分析前应绘制散点图——第一步 ;3.资料的要求 ; 反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数(b)或相关系数(r)的绝对值,而不是假设检验的P值。 P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围。 ;第三节 秩相关 (非参数统计方法) ;适用条件: ;一、Spearman秩相关;3. 计算公式 ;表9-3 某省1995年到1999年居民死因构成与WYPLL构成;检验步骤;二、相同秩较多时 rs 的校正;、 ;第六节 曲线拟合 (curve fitting); 医学现

文档评论(0)

danli208 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档