第十五章 直线相关与直线回归分析.ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十五章 直线相关与直线回归分析.ppt

直线相关与回归 直线相关与回归 学 习 目 标 1.说出直线相关与直线回归的概念; 2.说出等级相关的适用范围; 3.能计算直线相关系数与回归系数、进行假设检验; 4.能从专业角度考虑相关与回归的实际意义。 两个变量之间的关系大致分为两种: 1.两个变量共同变化的,是一种相互依赖的关系 例如身高与体重的关系。可以用相关分析方法去研究这种关系。可以研究两个变量之间的相互关系的密切程度和变化趋势,并用恰当的统计指标表达。 2.一个变量对另外一个变量有着某种依存关系 例如儿子的身高与父亲的身高有着某种依存关系,可以用回归分析的方法去研究这种关系,即把两个变量间的数量依存关系用函数形式表示出来,用一个或多个变量去推测另一个变量的估计值和波动范围,这就是回归分析。 为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 第一节 直 线 相 关 分 析 Linear Correlation 1.直线相关概念 概念:描述和推断两个(事件、现象)正态变量(x、y)总的变化趋势上协同变化规律性的密切程度和方向(但又非确定的函数关系)的统计分析方法。 协同变化:同增同减,此增彼减 2.直线相关的特点: 两变量同时进入数据分析; 两变量不区别为原因变量和结果变量,是一种互为因果的数量协同变化关系; 变量类型:两变量应同时满足正态分布的条件(实际工作中近似正态分布)。 相关分析 1.图示法:有无相关、相关程度、相关方向 2相关系数:在求相关系数前,最好先做图。 绘制散点图 分析研究两个变量x与y之间的关系时,两个变量的值可视为直角坐标系的一个点。为直观地判断两个变量间的关系,可把每对(x,y)变量值在直角坐标系标点出来,此为散点图。 若一个变量x由小到大(或由大变小),则另一变量相应地由小到大(或由大到小),两个变量的散点图呈直线趋势,可称这种现象为共变。 3、相关的类型 ★正相关 ★负相关 ★完全正相关 ★完全负相关 ★零相关 一、直线相关统计量 相 关 系 数 及 意 义 相关系数:相关系数是用以衡量两个变量线形相关有无、强弱与方向的统计指标。 总体参数: ? 样本相关系数:r 相关系数的计算公式 二、直线相关系数的计算 例15-1 某医师研究12名癫痫病人口服鲁米那后两小时唾液药物浓度与血液药物浓度之间的数量关系。试计算两种体液药物浓度间的直线相关关系。 (3)直 线 相 关 系 数 的 假 设 检 验 上例中的相关系数r等于0. 9256,说明了12名癫痫病人的唾液药物浓度与血液药物浓度之间存在相关关系。但是,这12名癫痫病人只是总体中的一个样本,由此得到的相关系数会存在抽样误差。 因为,总体相关系数(?)为零时,由于抽样误差,从总体抽出的12例,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数?=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。 对相关系数的假设检验,常用t检验,选用统计量t的计算公式如下: 相关一定有内在联系吗? 某君喜得贵子,庭前种一小树,每月测子高与树高,积累了数据。统计计算发现,子高与树高具有相关性,难道两者真有内在联系?原来子高与树高均与日俱增,时间变量与两者得潜在联系,造成了子高与树高的虚假联系。 相关关系与因果关系是一回事吗? 相关关系可能是: (1)两个变量之间存在依存因果关系,如由于遗传的原因,子女的身高数值的大小在很大程度上取决于父母的身高。 (2)两个变量之间存在相互的伴随关系,如“蛙鸣而燕至”,虽然年年如此,但蛙鸣永远也不能成为燕至的原因。 直线相关的应用 相关是研究两个变量间的相互关系,而且这种相互关系是用相关系数反应的。在确实存在相关关系的前提下,如果r的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个变量越有帮助;如果r绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无多大帮助。 一般说来,当样本量较大(n100),并对r进行假设检验,有统计学意义时,r的绝对值大于0.7,则表示两个变量高度相关;r的绝对值大于0.4,小于等于0.7时,则表示两个变量之间中度相关;r的绝对值大于0.2,小于等于0.4时,则两个变量低度相关。 前面我们讨论了12名癫痫病人的唾液药物浓度和血液药物浓度之间的关系,知道了二者之间成正相关。那

文档评论(0)

gshbzl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档