_研用-09回归.ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
_研用-09回归

一九九九年五月 第九章 直线相关与回归 杨丽-- 第九章 直线相关与回归 第九章 双变量回归与相关 研究两个数值变量间的数量关系 第一节直线回归 第二节直线相关 第三节秩相关 第四节加权直线回归 第五节两条回归直线的比较 SPSS过程 练习题 主讲人:暨南大学医学院医学统计学教研室 杨丽 yangli810@163.com 医学院大楼 834 第一节 直线回归 linear regression 回归概念 散点的趋势 直线回归方程的求导 统计推断 估计与预测 1 、例9-1 P182~184 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)。估计尿肌酐含量(Y)对其年龄(X)的回归方程。 根据变量间的关系,确定自变量和因变量。 年龄X为自变量,independent variable; 尿肌酐含量Y为因变量,dependent variable。 绘制散点图,观察点子的走向。 求导直线回归方程,并进行检验。 2、观察散点的分布趋势 以横轴为年龄X,纵轴为尿肌酐Y,将随机样本的n对变量值(X1,Y1),…,( Xn,Yn),即(13,3.54),(11,3.01),…,(7,2.65)(表9-1数据,共8记录),绘于图中,得散点图。 若有直线趋势,可进行 线性回归或相关分析。 尿肌酐含量Y 随年龄X 增加而增大,且呈直线 趋势。 异常点,outlier。 明显远离主体的数据。 3 、概念 回归(regression)分析 事物或现象间的数量依存关系。 直线回归,linear regression。 简单回归,simple regression。 两连续性变量X与Y之间的线性数量依存关系。 X为自变量,independent variable; Y为因变量,dependent variable。 回归关系是数量关系,不是一一对应的函数关系。 年龄和身高的关系。 主要任务:找出最适合的直线回归方程。 按某种要求,导出最接近实测点的直线。 4、直线回归方程? 直线回归方程, linear regression equation。 a为常数项;b为回归系数; ^Y为X值处Y的总体均数mY|X的一样本估计值。 回归方程的预测值,predicted value。 对于X各取值,相应Y的总体均数mY|X在一直线上。 假定每个对应的总体为正态分布,各总体分布的总体方差相等且各观测相互独立。 4.1 常数项a,constant term 截距,intercept,回归直线在Y轴的交点。 a = 0,交点在原点上; a 0,交点在原点的上方; a 0,交点在原点的下方。 统计意义:当X=0时,相应Y的均数估计值。 4.2 回归系数b, Coefficient of regression 斜率,slope。 直线越陡,斜率b = tg?越大。 不考虑其它变量的影响,表示任何两变量间的数量(依存)关系。 b=0:回归直线与x轴平行,即X与Y无直线关系; b0:直线从左下方走向右上方; b0:直线从左上方走向右下方; b=0,即回归方程不存在。 统计意义: 当X变化一个 单位,Y平均 改变的估计值 (b个单位)。 5、最小二乘原则? 要求:最小二乘原则,least sum of squares。 实测值与假定回归线上的估计值的纵向距离最短。 各实测值至回归直线的纵向距离平方和为最小。 利用最小二乘原则导出b和a的计算公式。 6、回归线 根据已求得的回归方程,取两点(X1,^Y1)和 (X2,^Y2)用直线连接。 在X实测值的范围内取X1(较小值)和X2(较大值); 把X1和X2代入回归方程,求出^Y1和^Y2; 将 (X1,^Y1)和 (X2,^Y2) 两坐标点描绘在散点图中; 用直线连接这两个坐标 点,得到方程的回归直线。 绘图时注意,两坐标点 之间要隔开一定的距离, 以减少回归线的误差。 7、 Y的离均差平方和lYY分解 8、回归方程检验—方差分析 H0:b=0,H1:b0,a=0.05。 SS总=lYY=1.0462; SS回=lXY2/lYY=0.8134; SS残=SS总-SS回=0.2328。 F=(SS回/n回)/(SS回/n回)=20.97** 结论:……有直线关系。 9、回归方程检验—t检验 H0:b=0,H1:b≠0,a=0.05。 sb为样本回归系数标准误。 扩大X的取值范围可减少, 使b的估计更稳定。 sY·X为回归的剩余标准差,standard deviation of residuals。 扣除X的影响后Y的变异指标。 F=t2:直线回归中,F检验 与t检验等价。 10、总体回归系数b的可

文档评论(0)

叮当文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档