第十二章 简单的回归分析卫生统计学考研课件.ppt

第十二章 简单的回归分析卫生统计学考研课件.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十二章 简单的回归分析卫生统计学考研课件

第十二章 简单回归分析   前面介绍了两变量间关联性分析,本章与下一章我们将进一步的介绍观察数据中变量间的数量依存性的回归关系。; 一、直线回归的概念及其统计描述; 表12-1 15名健康成人凝血时间与凝血酶浓度测量值    在通常情况下,研究者只能获取一定数量的样本数据,用该样本数据建立的有关Y与X变化的线性方程称为回归方程(regression equation)即:; 在描述两变量的关系时,一般把两个变量中能精确容易测量的作自变量,不易测量作为因变量。即用易测量的数据X估计不易测量的另一数据。如年龄估算小儿体重等。在描述凝血时间与凝血浓度的依存关系中,将凝血酶浓度作为自变量( X ),凝血时间作为应变量(Y)。由图12-1可见,凝血时间随凝血酶浓度增大而减少且呈直线趋势,但并非15点恰好全部都在一直线上。两变量数量间虽然存在一定关系,但不是十分确定的。这与两变量间严格对应的函数关系不同,称为直线回归(Linear regression)。直线回归是回归分析中最基本、最简单的一种,故又称简单simple regression)。;图 12-1 凝血浓度与凝血时间的散点分布;     二、回归模型的前提假设    线性回归模型的前提条件是:线性(linear)、独立(independent),正态(normal),等方差(equal variance) 1、线性是指反应变量Y的总体平均值与自变量X呈线性关系。 2、独立是指任意两观察值互相独立。 3、正态性假定是指线性模型的误差项?i服从正态分布。 4、等方差是指在自变量X取值范围内,不论X取什么值,Y都具有相同的方差。;二)回归参数的估计方法 a为Y轴上的截距;b为斜率,表示X每改变一个单位,Y的变化的值,称为回归系数;表示在X值处Y的总体均数估计值。为求a和b两系数,根据数学上的最小二乘法原理,可导出a和b的算式如下:;1.由原始数据及散点图的初步分析,本例呈直线趋势,故作下列计算。 2.求 3.计算X、Y的均数,及离均差平方和lXY、lyy与离均差积和lXY。 ;4.求回归系数b和截距a。 5. 列出回归方程 ;三)、直线回归方程的图示;图 12-3 凝血浓度与凝血时间的散点分布及拟合直线; 四、回归系数的统计推断;本章例12-1, ;二)总体回归系数?的假设检验 例12-2 检验例12-1 求凝血时间对凝血酶浓度的直线关系是否成立? 1.假设 2.检验统计量;三)回归系数的区间估计 例12-3 试用例12-11所计算的样本回归系数b=-0.6902,估计总体回归系数的 95%的可信区间:Sb=0.76, ;第二节 线性回归的应用 ;用同样方式,可计算出所有15个观测点的总体均数的95%置信区间。;;二、个体Y值的容许区间 总体中,X为某定值时,个体Y值的波动范围,其标准差SY(请勿与样本标准差相混)它为:    例12-5 用例12-1所求回归方程,试计算当X0=1.1时,个体Y值的95%容许区间。 即估计总体中凝血酶浓度1.1毫升者,有95%的人,凝血时间在12.9618~15.2297范围内。 ;;;第三节 残差分析; 图12-8 残差示意图 ; 第四节  非线性回归 一般而言,自然界的生命现象中绝对线性关系并不多见,但从相对与近似的观点出发,我们可以用前面已经提到的线性回归模型来解决许多实际问题。可以说,非线性回归要比线性回归更能充分地表达变量间的关系。当今线性回归都比非线性回归应用多,原因在于无论从数学理论还是计算方法,线性回归都比非线性回归模型简单得多。;一、通过自变量的变换实现线性化 实践中有两类非线性关系,一类是通过自变量X的适当变换可线性化,另一类是不可能通过自变量X的变换实现线性化的。 例如,假定观察样本(Xi,Yi),i=1,2,…,n满足 例如,假定观察样本(Xi,Yi),i=1,2,…,n满足 ; 但是诸如: 等情形,都不能通过自变量的变换实现线性化,只能通过应变量 Y的变换 实现线性化。;二、变换自变量实现线性回归的步骤 1.将观察样本(Xi,Yi),i=1,2,…,n 作散点图,观察散点分布特征类似于何种函数类型; 2.按照所选定的函数进行相应的变量变换; 3.对变换后数据用常规最小二乘法(OLS)作线性模型的参数估计。 4.一般拟合多个相近的模型,然后对各个模型的拟合优度评价挑选较为合适的模型。;例12-2 为了研究某药物浓度与肾上腺释放量关系,选取10个药物浓度水平,每种药物剂量水平上重复5次试验,观测结果如表12-3所示。

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档