医学统计学第九章.pptVIP

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章 直线相关与回归 医学研究中,常常要研究两个或两个以上变量的关系。如成人的身高与体重、青少年的身高与年龄、体温与脉搏次数、年龄和血压、反应物浓度与反应速度、溶液浓度与渗透压等。相关与回归就是研究这种关系的统计方法。 变量与变量之间的关系,可以分成两种类型:一种是确定性关系(函数关系),另一种是非确定性关系。 如果仅仅研究变量间相互关系的密切程度和变化趋势,并用适当的统计指标表达,这就是相关分析。 如果要把变量间数量上依存关系用函数形式表示出来,用一个或多个变量来推测另一变量的估计值及波动范围,这就是回归分析。 回归一词最早由Golton在一项有关父亲与儿子身高的研究中提出。儿子的高度与父亲的高度自然是相关的。他发现身材高大的父亲所生儿子的高度不少要比其父亲矮,而身材矮小的父亲所生儿子的高度不少要比父亲高;也就是说,无论是身材高还是矮的父亲所生儿子的身高有向人群的平均身高回归的趋势,这就是回归的生物学内涵,后来人们借用回归这个词来描述通过自变量的数值预测反映变量的平均水平。 9.1 直线相关 9.1.1 直线相关的概念 当所研究的两个事物或现象之间,既存在着密切的数量关系,又不象函数关系那样,能以一个变量的数值精确地求出另一个变量的数值,我们称这类变量之间的关系称为相关关系。 直线相关分析关心的是两个变量间是否有线性的协同变化的关系、变化的趋势、变化的密切程度和方向。 直线相关的性质可由散点图(scatter diagram)直观地说明。通常以自变量(independent variable)X为横坐标,应变量(dependent variable)Y为纵坐标,在方格坐标中,每对变量值(X、Y)的交叉点处,描出一个点,就成为散点图。从散点图上可以粗略地看出,两个变量间相关的方向和密切程度以及两变量间是否呈直线关系。 例9-1 某医师研究某种代乳粉营养价值时,用大白鼠做实验,得大白鼠进食量与体重增加量的资料(表9-1)。 表9-1 大白鼠进食量与体重增加量的关系 图9-1大白鼠进食量与体重增加量的散点图 图9-2 相关系数示意 9.1.2 相关系数的计算与检验 1)相关系数的意义 相关系数(correlation coefficient )又称为积差相关系数(coefficient of product-moment correlation),以符号r表示。它是说明具有线性关系在两个变量间,相关关系的密切程度和方向的指标。样本相关系数用符号r表示,总体相关系数用希腊字母ρ(读作rho)表示,计算公式为: 2)计算相关系数 例9-2 现仍用例9-1的资料,试分析大白鼠进食量与体重增加量之间有无直线相关关系?1.作散点图,判断是否有线性趋势。从图9-1可知,两变量有线性趋势,成正相关。 2.列相关系数计算表 3.按公式9-1得相关系数 r 3)相关系数的假设检验 相关系数r是样本相关系数,它是总体相关系数ρ的估计值。和其他统计量一样,根据样本资料计算出来的相关系数也有抽样误差。在ρ=0的总体中随机抽样,由于抽样误差的影响,所得r值常不等于零。因此,在计算得到相关系数后,还不能根据的大小对X、Y间是否有相关关系作判断,而应进行r是否来自ρ=0的假设检验。相关系数的假设检验可用t检验法,其计算统计量t值的公式为: (1)建立假设,确定检验水准 (2)计算检验统计量 (3)查表确定p值 P0.001 (4)做出统计结论 可认为大白鼠进食量与体重增加量之间呈正相关。 相关系数的假设检验亦可按υ=n-2,直接查相关系数r界值表(附表),当 <rα(υ)时,P>α;当 ≥rα(υ)时,P≤α。本例r=0.8529,按υ=n-2=12-2=10,查r界值表,r0.01(10)=0.708,因r> r0.01(10),故P<0.01。 9.2 直线回归 9.2.1直线回归的概念 直线回归分析的目的:建立一个线性函数,来描述两个变量的依存关系。 回归分析中两变量的地位是不相同的: 通常把一个变量称为自变量,用X表示;另一个变量称为应变量,用Y表示。 散点图的带状分布有线性趋势 直线回归分析在于找出两个变量有依存关系的直线方程,以确定一条能代表这些数据关系的、最接近各实测点的直线,使各实测点的与该线的纵向距离的平方和为最小。为了区别于一般的函数方程,我们称之为直线回归方程 9.2.2 回归方程的建立与检验 直线回归方程的一般表达式为: a是回归直线在Y轴上的截距 ,即X=0时的值; b为回归系数,即直线的斜率。 b0,表示直线从左下方走向右上方,即Y随X的增大而增大;

文档评论(0)

zilaiye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档