- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7-直线回归与相关分析
直线相关与回归分析;两变量或多变量之间的关系,总起来可分为两类,一类是函数关系,确定关系的例子,在生物界中是极少见的。
生物中,大量存在的情况是:一种变量受另一种变量的影响,两者之间既有关系,但又不存在完全确定的函数关系。知道其中一种变量,并不能精确求出另一变量。下面请同学们举几个例子。
单位面积的施肥量、播种量和产量三者之间的关系。
树木胸径与树木高度的关系。
人类血压与年龄的关系。
玉米的穗长与穗重的关系。
人的身高与体重的关系。;身高与胸围、体重; 生物学中,研究两变量间的关系,主要是为了探求两变量的内在联系,或者是从一个变量X去推测另一个随机变量Y.例如,我们希望通过施肥量X去推测Y
如果对于变量X的每一个可能的值xi,都有随机变量Y的一个yi与之对应,则称随机变量Y对变量X存在回归关系。
为了确定相关变量之间的??系,首先应该收集一些数据,这些数据应该是成对的,然后在直角坐标系上描述这些点,这一组点集称为散点图。;为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 ;散点图(scatter diagram); 1 2 3 4 5 6;第一节:回归与相关的概念;x;在大量测量各种身高人群的体重时会发现,虽然在同样身高下,体重并不完全一样。但在每一身高下,都有一个确定的体重分布与之相对应;;例:土壤内NaCl含量对植物的生长有很大影响,NaCl含量过高,将增加组织内无机盐的累积,抑制植物生长。下表中的数据是每1000g土壤中所含NaCl的不同克数(X),对植物单位叶面积干物重的影响。 ;散点图如下 ;变量1;黏虫孵化历期平均温度与历期天数关系图;若我们增加每一NaCl浓度下的观测次数,其散点图如下:(可见其平均值更趋近于一条直线) ;平均数有一个特性,即在各种离差平方和中,以距平均数的离差平方和最小。我们把观测值与回归估计值之间的离差平方和最小时的回归线作为最好的回归线。其方法为最小二乘法;回归直线在平面坐标系中的位置取决于a,b的取值。;;Y=a+bx;0;是否真正存在线性关系
回归关系是否显著
因此,求出回归方程后须作统计检验,称回归显著性检验。;作回归分析时要有实际意义。;进行直线回归分析之前,绘制散点图。;直线回归的适应范围一般以自变量的取值为限。;描述两变量间的依存关系。;捕样期数;一、相关系数;;在研究水稻籽粒蛋白质含量(%)时,采用两种不同的测定方法。一种是凯氏定氮法(KP法),另一种是染料结合法(DBC法)。用两种方法测得的结果如下:;Excel中函数correl求得
r=0.952832 n=10
查附表12
独立变量k=1,剩余df=10-2=8,
r0.01=0.765,
|r|r0.01
结论是用KP法与用DBC法测得的水稻籽粒蛋白质含量间有极显著的相关。;两变量间依存变化的数量关系;有些资料用相关表示较适宜,比如兄弟与姐妹间的身长关系、人的身长与前臂长之间的关系等资料。;注意问题;对相关分析的作用要正确理解。;注意问题;注意问题;可直线化的
非线性回归分析;生物学中两变量间呈曲线关系的例子很多。
例如生物生长中某时期的重量与时间的关系、细菌生长的数量与时间的关系等,都不是用简单的直线关系所能表达的。
这时应选择适当类型的曲线,使之能更符合两变量的实际关系。在确定了两变量间所呈函数关系以后,需通过适当变换(transform) ,便可将曲线化为直线,再按直线回归处理。 ;常用的直线化方法;专业知识、经验或文献确定曲线类型;在辐射遗传和药理学实验中,经常遇到寻找半致死剂量问题。
致死率与剂量间的关系曲线往往程S形。在半致死处,曲线的曲率最大,与死亡率的交点最清楚。在全致死处,曲线与死亡率已近于平行,交点不清,剂量也就不好确定了。因此在实际工作中,常常用半致死尽量这一标准。
确定半致死剂量,最常用的方法是对数据进行概率对数变换。
;例:用不同计量的r射线照射小麦品种库斑克,调查死苗率,得到以下结果: ;Y= 18多元线性
回归分析;主穗重X1
文档评论(0)