网站大量收购独家精品文档,联系QQ:2885784924

第9章回归和相关分析.pptVIP

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第9章回归和相关分析

第 九 章 相 关 与 回 归; 主要内容;一 线性相关的概念 线性相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布(bivariate normal distribution)资料。其性质可由散点图直观的说明。 目的:研究 两个变量X,Y数量上的依存(或相关) 关系。 特点:统计关系 ;;二、相关系数的意义与计算;例9-1 某地15名3岁儿童体重与体表面积资料如表9.1,试求相关系数。 由例9-1得 由公式得;相关系数的特点;相关系数的统计推断 ; 例9-2 继例9-1中算得r=-0926后,试检验相关是否具有统计学意义;检验步骤;线性相关中应注意的问题;简单回归分析 Simple linear regression analysis;双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), …, (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本——直线回归、直线相关;直线回归的概念 ; 为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表9-1)进行回归分析,得到图9-1所示散点图(scatter plot) ;; 由图9-1可见,凝血时间随凝血酶浓度的增加而减低且呈直线趋势,但并非所有点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linear regression),其方程叫直线回归方程,以区别严格意义的直线方程。回归是回归分析中最基本、最简单的一种,故又称简单回归。 ;样本线回归方程;1.a 为回归直线在 Y 轴上的截距;残差(residual)或剩余值,即实测值Y与假定回归线上的估计值 的纵向距离 。 求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。;Y的离均差,总变异; ; 为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表9-1)进行回归分析,得到图9-1所示散点图(scatter plot) ;No.;本例:n=15 ΣX=14.7 ΣX2=14.81 ΣY=224 ΣXY=216.7 ΣY2=3368;;回归方程的假设检验 ;;;1.方差分析 ;Y的离均差,总变异;第二 节 线性回归的应用 (估计和预测) ;反映其抽样误差大小的标准误为;例9-1中,第一观测值X1=1.1, 0.4994, 0.404, 代入(9.8)式获得第一观测点X1对应的 的标准误为 0.1599 Y的总体均数的95%置信区间为 14.0957±(2.16)(0.1599)=(13.7502,14.4412) ;对象;以上是给定某一X值时所对应的总体均数的置信区间。当同时考虑X的所有可能取值时,总体均数的点估计就是根据样本算得的回归直线 (1-α)置信区间的上下限连起来形成一个弧形区带,称为回归直线的(1-α)置信带(confidence band)。同样,因为其标准误是X的函数,所以在均数( )点处置信带宽度最小,越远离该均数点,置信带宽度越大。 ;图9-4中,左图显示位于最小二乘回归线上下两侧的两条弧形虚线为总体回归线的(1-α)置信区带。右图的实线表示可能的总体回归线,它们落在弧形虚线所确定的置信带内。 (1-α)置信带的意义是:在满足线性回归的假设条件下,可以认为真实的回归直线落在两条弧形曲线所形成的区带内, 置信度为(1-α) ;;PI;决定系数(coefficient of determination) ; ;2.进行回归分析前应绘制散点图;3.资料的要求 ; 反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P值。 P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围。 ;谢谢大家!

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档