第08章 线性相关与回归.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第08章 线性相关与回归

生物统计学 线性相关与回归 计量资料单变量的统计描述与统计推断。 试问:为何说是单变量?因为每种类型只牵涉一个变量。 许多现象之间(即变量之间)都有相互联系 在这些有关系的现象中,它们之间联系的程度和性质也各不相同。 有的现象之间因果不清,只是伴随关系。 相关与回归就是用于研究和解释两个变量之间相互关系的。 十九世纪英国人类学家 F.Galton首次在《自然遗传》一书中,提出并阐明了“相关”和“相关系数”两个概念,为相关论奠定了基础。其后,他和英国统计学家 Karl Pearson对上千个家庭的身高、臂长、拃长(伸开大拇指与中指两端的最大长度)做了测量,并做成散点图。 儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系: 即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”。 Regression 释义 小插曲——F.Galton Galton(1822-1911)是一位人类学家,著名生物学家达尔文的表兄弟,早年学医,曾在剑桥大学念书。尽管他的数学不是很好,但在人类学和优生学研究中萌发的统计学思想,对生物统计的发展产生了深远影响,如“回归”、 “双变量正态分布”的概念等。他没有子女,但一生写了9部书,发表了近200篇论文。1860年当选英国皇家学会会员,1909年被封为爵士,1910年获得英国皇家学会Copley奖。 本章内容 第一节 线性相关 例:考察身高与体重的伴随关系 线性相关的概念 图中不是每个身材较高的对象必有较重的体重,但大多数对象的体重Y与其身高X的变化呈一种伴随增大或减小的直线变化趋势,这种现象称为直线相关 。 刻画两个随机变量之间线性相关程度称为线性相关(linear correlation) 线性相关的类型 ★ 正相关 ★负相关 ★称零相关 ★ 完全正相关 ★完全负相关 线性相关系数 线性相关系数 (linear correlation coeffiecient) ,简称相关系数。或 Pearson相关系数 相关系数是描述两个变量之间线性相关的程度和相关方向的统计指标。样本相关系数用 r 表示,总体相关系数用ρ表示。 相关系数的特点: 相关系数的计算公式 lxx(x 的离均差平方和 ) lyy (y 的离均差平方和 ) lxy (x和y的离均差乘积和,简称乘积和) 实例分析 健康调查发现男青年身高与他的前臂长有关; 于是设想,通过测量男青年的身高,可以预测其前臂长,以便更好对男青年的发育情况进行评价。因此随机抽取了11名男青年组成样本,分别测量每个人的身高和前臂长。 问男青年的身高与前臂长之间的相关系数是多少?是正相关还是负相关? 分析问题:总体-样本、 目的、变量、关系 分析步骤 男青年身高与前臂长的测量结果(cm)的散点图 上例中的相关系数 r 等于0.8009,说明了11例样本中男青年的身高与前臂长之间存在相关关系。但是,这11例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。 因为,总体相关系数(?)为零时,由于抽样误差,从总体抽出的11例,其 r 可能不等于零。 这就要对 r 进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。 资料相关系数的假设检验步骤 相关分析应注意的问题 1. 作散点图: 分析要两变量之间有无相关关系可先作散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再计算相关系数和作假设检验; 2. 正态性:相关系数的计算要求两个变量必须服从正态分布,如果资料不服从正态分布,应先通过变量变换,使得两个变量正态化,再根据变换值计算相关系数; 3. 作假设检验: 依据公式计算出的相关系数仅是样本相关系,它是总体相关系数的一个估计值,与总体相关系数之间存在着抽样误差,要判断两个事物之间有无相关关系及相关的密切程度,必须作假设检验。 当检验拒绝了无效假设时,才可以认为两个事物之间存在着相关关系,然后再根据计算出的相关系数大小来判断根相关关系的密切程度; 4. 相关关系:相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系,例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及到第三个因素?? 年龄。当儿童长大一些,他

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档