网站大量收购闲置独家精品文档,联系QQ:2885784924

第九章回归和相关分析.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 九 章 相 关 与 回 归 主要内容 一 线性相关 二 秩相关 三 分类变量的关联性分析 一 线性相关的概念 线性相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布(bivariate normal distribution)资料。其性质可由散点图直观的说明。 目的:研究 两个变量X,Y数量上的依存(或相关) 关系。 特点:统计关系 二、相关系数的意义与计算 1. 意义:相关(correlation coefficient)又称Pearson积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。 例9-1 某地15名3岁儿童体重与体表面积资料如表9.1,试求相关系数。 由例9-1得 由公式得 相关系数的特点 1.相关系数r是一个无量纲的数值,且-1r1; 2.r0为正相关,r0为负相关; 3./r/越接近于1,说明相关性越好./r/越接近于0,说明相关性越差. 相关系数的统计推断 (一)相关系数的假设检验 例9-2 继例9-1中算得r=-0926后,试检验相关是否具有统计学意义 检验步骤 线性相关中应注意的问题 1.样本的相关系数接近零并不意味着两变量间一定无相关性. 2.一个变量的数值人为选定时莫作相关. 3.出现异常值时甚用相关. 4.相关未必真有内在联系. 5.分层资料盲目合并易出假象. 简单回归分析 Simple linear regression analysis 双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), …, (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本——直线回归、直线相关 直线回归的概念 目的:研究应变量Y对自变量X的数量依 存关系。 特点:统计关系。 X值和Y的均数的关系不同于一般数学上的X 和Y的函数关系 为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表9-1)进行回归分析,得到图9-1所示散点图(scatter plot) 由图9-1可见,凝血时间随凝血酶浓度的增加而减低且呈直线趋势,但并非所有点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linear regression),其方程叫直线回归方程,以区别严格意义的直线方程。回归是回归分析中最基本、最简单的一种,故又称简单回归。 1.a 为回归直线在 Y 轴上的截距 回归参数的估计 ——最小二乘原则 残差(residual)或剩余值,即实测值Y与假定回归线上的估计值 的纵向距离 。 求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。 为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表9-1)进行回归分析,得到图9-1所示散点图(scatter plot) 本例:n=15 ΣX=14.7 ΣX2=14.81 ΣY=224 ΣXY=216.7 ΣY2=3368 回归方程的假设检验 建立样本直线回归方程,只是完成了统计分析中两变量关系的统计描述,研究者还须回答它所来自的总体的直线回归关系是否确实存在,即是否对总体有 ? 第二 节 线性回归的应用 (估计和预测) 例9-1中,第一观测值X1=1.1, 0.4994, 0.404, 代入(9.8)式获得第一观测点X1对应的 的标准误为 0.1599 Y的总体均数的95%置信区间为 14.0957±(2.16)(0.1599)=(13.7502,14.4412) 以上是给定某一X值时所对应

文档评论(0)

jdy261842 + 关注
实名认证
内容提供者

分享好文档!

1亿VIP精品文档

相关文档