医学统计学线性回归分析(2).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十二章 双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 亿,丫2 ),???,(Xn,Yn ) 目的:研究X和Y的数量关系 方法:归与相关 方法: 归与相关 历史背景: 英国人类学家F.Galton首次在《自然遗传》 一书中,提出并阐明了 “相关”和“相关系数” 两个概念,为相关论奠定了基础。其后,他和 英国统计学家Karl Pearson对上千个家庭的身 高、臂长、扌乍长(伸开大拇指与中指两端的最 大长度)做了测量,发现: 儿子身高(匕英寸)与父亲身高(X, 英寸)存在线性关系: 。 f = 33.73+ 0.516T的子代在成年之后的身 高平均来说不是更高,而是稍矮于其父代水 平,而矮个子父代的子代的平均身高不是更 矮,而是稍高于其父代水平。柯将这种 趋向于种族稳定的现象称之“回归” o 目前,“回归”已成为表示变量 之间某种数量依存关系的统计学术语, 并且衍生出“回归方程” “回归系数” 等统计学概念。如研究糖尿病人血糖 与其胰岛素水平的关系,研究儿童年 龄与体重的关系等。 第一节两相关变量的散点图 一、直线回归的概念 目的:研究应变量Y对自变量X的数量依 存关系。 特点:统计关系。X值和Y的均数的关系, 不同于一般数学上的X和Y的函数 为了直观地说明两相关变量的线性 依存关系,用表12?1第(2)、(3) 列中大白鼠的进食量和体重增加量 的数据在坐标纸上描点,得图12?1所 示的散点图(scatter* plot)。 例12?1用某饲料喂养12只大白鼠, 得岀大白鼠的进食量与体重增加量 如表12-1,试绘制其散点图。 表12?1 12只大白鼠的进食量 序号 逬食量 体重增加量炸)T (1) ⑵ (3) 1 305.7 23 6 188.6 14.7 3 277.2 19.2 4 364 8 77 ~ 5 285 3 18.9 6 244.7 16.1 7 9 17.2 8 149 8 12.9 9 268.9 18.3 10 247 6 17.7 11 1688 13.7 12 200.6 15.6 合计 2957.9 215.6 (龙卫 ( (g)与体重增加量(g)测量结果 -V2 F2 XY (4) (5) (6) 93452.49 556.96 7214.52 35569.96 216.09 ?* 76839.84 368.64 5322.24 133079.04 767.29 10104.96 81396.09 357.21 5392.17 59878.09 259.21 3939.67 65484.81 295.84 4401 48 22440 04 166 41 1932.42 72307.21 334.89 4920.87 61305.76 313.29 4382.52 28493.44 187.69 2312.56 4024036 243.36 3129.36 770487.13 4066.9 55825.2 S厂〉 (SA1) 5 0 5 0 T—I T—I 、亠二三迂苣一 0 130 180 230 280 330 380 进食量(g) , X 图12-1 12只大白鼠进食量与体重增重量散点图 在定量描述大白鼠进食量与体重增 加量数量上的依存关系时,习惯上将进 食量作为自变量(independent variable), 用X表示;体重增加量作为应变量 (dependent variable),用 Y表示。 由图12?1可见,体重增加量有随进食 量增加而增大的趋势,且散点呈直线趋势, 但并非12个点都在直线上,此与两变量间 严格的直线函数关系不同,称为直线回归 (linear regression),其方程叫直线回归方程,以 区别严格意义的直线方程。 回归是回归分析中最基本、 回归是回归分析中最基本、 故又称简单回归。 第二节 回归方程 ?、直线回归方程的一般表达式为 Y^a+bX (12-1) Y为各X处Y的总体均数的估计。 1?a为回归直线在丫轴上的截距。 0,表示直线与纵轴的交点在 原点的上方; ?0,则交点在原点的下方; ? = 0,则回归直线通过原点。 2为回归系数,即直线的斜率。 Z?0, Z?0, 大; 直线从左下方走向右上方,Y随X增大而增 A bvO,直线从左上方走向右下方,Y随X增大而减 小; b=0,表示直线与X轴平行,X与Y无直线关系。 万的统计学意义是:X每增加(减)一个 单位,丫平均改变方个单位。 二、直线回归方程的求法 >残差(residual)或剩余值,即实测值丫与假定 回归线上的估计隹r的纵向距罢r - r. a求解:实际上就是“合理地”找到一条 能最好地代表数据点分布趋势的直线。 原则:最小二乘法(

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档