医学统计学第九章第二十一讲.pptVIP

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章 直线相关与回归 前面章节学习的内容属于单变量分析 如:t检验、u检验、?2检验 、秩和检验、方差分析 医学研究中,常常要研究两个或两个以上变量的关系。相关与回归就是研究这种关系的统计方法。 变量与变量之间的关系,可以分成两种类型:确定性关系(函数关系)与非确定性关系。 确定性关系:如圆面积与半径的关系 非确定性关系:身高与体重、年龄与身高 如果仅仅研究变量间相互关系的密切程度和变化趋势,并用适当的统计指标表达,这就是相关分析。 如果要把变量间数量上依存关系用函数形式表示出来,用一个或多个变量来推测另一变量的估计值及波动范围,这就是回归分析。 变量间的关系可分为: 线性(直线)与非线性(曲线); 变量的个数可分为: 一元(两个变量)与多元(多个变量)相关和回归。 统计学中“回归”一词的由来 最早由Golton在一项有关父亲与儿子身高的研究中提出。儿子的高度与父亲的高度自然是相关的。他发现身材高大的父亲所生儿子的高度不少要比其父亲矮,而身材矮小的父亲所生儿子的高度不少要比父亲高;也就是说,无论是身材高还是矮的父亲所生儿子的身高有向人群的平均身高回归的趋势,这就是回归的生物学内涵,后来人们借用回归这个词来描述通过自变量的数值预测反映变量的平均水平。 9.1 直线相关 9.1.1 直线相关的概念 当所研究的两个事物或现象之间,既存在着密切的数量关系,又不象函数关系那样,能以一个变量的数值精确地求出另一个变量的数值,我们称这类变量之间的关系称为相关关系。 直线相关分析关心的是两个变量间是否有线性的协同变化的关系、变化的趋势、变化的密切程度和方向。 直线相关的性质可由散点图(scatter diagram)直观地说明。通常以自变量(independent variable)X为横坐标,应变量(dependent variable)Y为纵坐标,在方格坐标中,每对变量值(X、Y)的交叉点处,描出一个点,就成为散点图。从散点图上可以粗略地看出,两个变量间相关的方向和密切程度以及两变量间是否呈直线关系。 【例9.1】 某医师研究某种代乳粉营养价值时,用大白鼠做实验,得大白鼠进食量与体重增加量的资料(表9-1)。 表9.1 大白鼠进食量与体重增加量的关系 图9.1大白鼠进食量与体重增加量的散点图 图9.2 相关系数示意 9.1.2 相关系数的计算与检验 1)相关系数的意义 相关系数又称为积差相关系数,以符号r表示。它是说明具有线性关系在两个变量间,相关关系的密切程度和方向的指标。样本相关系数用符号r表示,总体相关系数用希腊字母ρ表示,计算公式为: 相关系数 r 的性质 r的范围: 。 当 =1时,为完全相关;当0r1时,为正相关;当-1r0时,为负相关;当r=0时,为0相关。 r的绝对值大小表示两变量之间直线联系的密切程度。 r的符号表示两变量协同变化的方向 r0时,同向变化 r0时,反向变化 2)计算相关系数 【例9.2】 现仍用例9.1的资料,试分析大白鼠进食量与体重增加量之间有无直线相关关系? (1)作散点图,判断是否有线性趋势。从图9.1可知, 两变量有线性趋势,成正相关; (2)列相关系数计算表; (2)列相关系数计算表; (3)按公式9.1得相关系数r=0.8529。 3)相关系数的假设检验 根据样本资料计算出来的样本相关系数r是总体相关系数ρ的估计值。它们间的抽样误差不可避免。 在ρ=0的总体中随机抽样,由于抽样误差的影响,所得r值常不等于零。因此,在计算得到相关系数后,还不能根据 的大小对X、Y间是否有相关关系作判断,而应进行r是否来自ρ=0的假设检验。 相关系数的假设检验可用t检验法,其计算统计量t值的公式为: 解: (1)建立假设,确定检验水准 (2)计算检验统计量 (3)查表确定p值 查t界值表,得p0.01 附表4 t界值表 概率,p 自由度 单侧 0.10 0.05 0.025 0.01 0.005 0.001 双侧 0.20 0.10 0.050 0.02 0.01 0.002 1 3.078 6.314 12.706 31.821 63.657 318.309 2

文档评论(0)

zilaiye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档