简单回东归分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简单回东归分析

英国人类学家 F.Galton首次在《自然遗传》一书中,提出并阐明了“相关”和“相关系数”两个概念,为相关论奠定了基础。其后,他和英国统计学家 Karl Pearson对上千个家庭的身高、臂长、拃长(伸开大拇指与中指两端的最大长度)做了测量,发现: 儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系: 。 也即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归” “回归”已成为表示变量之间某种数量依存关系的统计学术语,相关并且衍生出“回归方程”“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。 简单回归分析 Simple linear regression analysis 参考书 1. 徐勇勇主编. 医学统计学(第二版). 北京:高等教育出版社,2004 2. 杨树勤主编. 卫生统计学(第二版). 北京:人民卫生出版社,1991 3. 方积乾主编. 医学统计学与电脑实验(第二版). 上海:上海科学技术出版社,2001 4. 孙振球主编. 医学统计学(供研究生用). 北京:人民卫生出版社,2004 本章内容 第一节 简单线性回归 第二节 线性回归的应用 第三节 残差分析 教学目标 了解回归的思想来源 掌握线性回归方程的计算,回归系数的假设检验的思想和步骤 了解回归方程的应用 双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), …, (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本——直线回归、直线相关 线性回归的概念及其统计描述 直线回归的概念 目的:研究应变量Y对自变量X的数量依 存关系。 特点:统计关系。 X值和Y的均数的关系, 不同于一般数学上的X 和Y的函数关系 为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表1)进行回归分析,得到图1所示散点图(scatter plot) 在定量描述健康人凝血酶浓度(X)与凝血时间(Y)数据的数量上的依存关系时,将凝血酶浓度称为自变量(independent variable),用 X 表示;凝血时间称为应变量(dependent variable),用 Y 表示 相关系数反映了散点的疏密,一个变量对另一个变量的影响需用回归分析。 对于线性回归,若只有1个自变量,称为简单回归(simple regression);若有2个或2个以上自变量,称为多重回归(multiple regression)。 当这种数量关系为曲线关系时,称为曲线回归/非线性回归(curve regression/nonlinear regression)。 1.a 为回归直线在 Y 轴上的截距 a 0,表示直线与纵轴的交点在原点的上方 a 0,则交点在原点的下方 a = 0,则回归直线通过原点 2. b为回归系数,即直线的斜率 b0,直线从左下方走向右上方,Y 随 X 增大而增大; b0,直线从左上方走向右下方,Y 随 X 增大而减小; b=0,表示直线与 X 轴平行,X 与Y 无直线关系 线性回归模型的假设条件 1.线性(line) 自变量和因变量之间的关系有线性趋势 散点图 2.独立(independence) n个个体之间相互独立 专业知识,残差图 3.正态(normal)各x所对应的y服从正态(误差项服从正态分布 ) 残差的直方图,正态概率图 4. 等方差(equal variance) 各x值变动时,相应的y有相同的变异性 散点图,残差图 回归参数的估计 ——最小二乘原则 残差(residual)或剩余值,即实测值Y与假定回归线上的估计值 的纵向距离 。 求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。 本例:n=15 ΣX=14.7 ΣX2=14.81 ΣY=224 ΣXY=216.7 ΣY2=3368 3、计算有关指标的值 4、计算回归系数和截距 5、列出

文档评论(0)

135****1071 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档