网站大量收购闲置独家精品文档,联系QQ:2885784924

用Excel计算相关系数和进行回归分析5.docVIP

用Excel计算相关系数和进行回归分析5.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用Excel计算相关系数和进行回归分析5

第一节? 回归和相关的概念 ?   前几章的方法都只涉及一种变量,主要是比较它的各组值之间的差异。但生物学所涉及的问题是多种多样的,对许多问题的研究需要考虑不只一个变量,例如生物的生长发育速度就与温度,营养,湿度 …… 等许多因素有关,我们常常需要研究类似的多个变量之间的关系。这种关系可分为两大类,即相关关系与回归关系。 相关关系 :两变量 X , Y 均为随机变量,任一变量的每一可能值都有另一变量的一个确定分布与之对应。 回归关系 : X 是非随机变量或随机变量, Y 是随机变量,对 X 的每一确定值 x i 都有 Y 的一个确定分布与之对应。   从上述定义可看出相关关系中的两个变量地位是对称的,可以认为它们互为因果;而回归关系中则不是这样,我们常称回归关系中的 X 是自变量,而 Y 是因变量。即把 X 视为原因,而把 Y 视为结果。   这两种关系尽管有意义上的不同,分析所用的数学概念与推导过程也有所不同,但如果我们使用共同的标准即使 y 的残差平方和最小(最小二乘法,详见下述),则不管是回归关系还是相关关系都可以得到相同的参数估计式。因此本章将集中讨论数学处理较简单的回归关系,且 X 限定为非随机变量。从这些讨论中所得到的参数估计式也可用于 X 为随机变量的情况,但我们不再讨论 X 为随机变量时的证明与推导。   另外,回归分析和相关分析的目的也有所不同。回归分析研究的重点是建立 X 与 Y 之间的数学关系式,这种关系式常常用于预测,即知道一个新的 X 取值,然后预测在此情况下的 Y 的取值;而相关分析的重点则放在研究 X 与 Y 两个随机变量之间的共同变化规律,例如当 X 增大时 Y 如何变化,以及这种共变关系的强弱。由于这种研究目的的不同,有时也会引起标准和方法上的不同,我们将在相关分析一节中作进一步介绍。   从两个变量间相关(或回归)的程度来看,可分为以下三种情况:   ( 1 ) 完全相关 。此时一个变量的值确定后,另一个变量的值就可通过某种公式求出来;即一个变量的值可由另一个变量所完全决定。这种情况在生物学研究中是不太多见的。   ( 2 ) 不相关 。变量之间完全没有任何关系。此时知道一个变量的值不能提供有关另一个变量的任何信息。   ( 3 ) 统计相关 (不完全相关)。介于上述两种情况之间。也就是说,知道一个变量的值通过某种公式就可以提供关于另一个变量一些信息,通常情况下是提供有关另一个变量的均值的信息。此时知道一个变量的取值并不能完全决定另一个变量的取值,但可或多或少地决定它的分布。这是科研中最常遇到的情况。本章讨论主要针对这种情况进行。为简化数学推导,本章中如无特别说明,一律假设 X 为非随机变量,即 X 只是一般数字,并不包含有随机误差。但所得结果可以推广到 X 为随机变量的情况。    两个变数资料的散点图    将两个变数的 n 对观察值 ( x 1 , y 1 ) 、 ( x 2 , y 2 ) 、 … 、 ( x n , y n ) 分别以坐标点 的形式标记于同一直角坐标平面上得到的图,称为散点图 (scatter diagram) 。                       第二节? 直线回归 ?   前边已经说过,回归关系就是对每一个 X的取值x i ,都有Y的一个分布与之对应。在这种情况下,怎么建立X与Y的关系呢?一个比较直观的想法就是建立X与Y的分布的参数间的关系,首先是与Y的均值的关系。这就是条件均值的概念,记为: 。它的意思是在X=x 1 的条件下,求Y的均值。更一般地,我们用 代表X取一切值时,Y的均值所构成的集合。所谓一元线性回归,就是假定X与 之间的关系是线性关系,而且满足: ( 9.1 ) 此时进行回归分析的目标就是给出参数 α和β的估计值。   [例 9.1] 对大白鼠从出生第6天起,每三天称一次体重,直到第18天。数据见表5.1。试计算日龄X与体重Y之间的回归方程。 表 9.1 大白鼠6-18日龄的体重 序号 1 2 3 4 5 日龄 x i 6 9 12 15 18 体重 y i 11 16.5 22 26 29   首先,我们可以把数对( x i , y i )标在 X-Y 坐标系中,这种图称为散点图。它的优点是可以使我们对 X 、 Y 之间的关系有一个直观的、整体上的印象,如它们是否有某种规律性,是接近一条直线还是一条曲线,等等。我们还可以画很多条接近这些点的直线或曲线,但这些线中的哪一条可以最好地代表 X, Y 之间的关系,就不是凭直观印象可以做出判断的了。例如对例 9.1 ,我们可画出如下的散点图: 图 9.1 大白鼠日龄 —体重关系图      图中的点

您可能关注的文档

文档评论(0)

woai118doc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档