第五章相关与回归.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章相关与回归

第五章 相关与回归 Regression and Correlation 5.1 回归和相关的概念 concept of regression and correlation 5.2 直线回归 Linear regression 5.3 直线回归的分析 Linear regression analysis 5.4 协方差分析 Covariance analysis 5.1 回归和相关的概念 两个变数之间的关系有函数关系和统计关系。 函数关系是一种确定关系,如,面积S=L×W 统计关系是非确定关系,即一个变数受另一个变数的影响,但又不是确定的函数关系。如,施肥与产量,雨量与湿度等。 两个变数一般用Y和X表示,统计学将它们的关系分为因果关系和相关关系。 因果关系是指一个变量的变化引起另一个变量的相应变化,即一个是引起变化的原因,一个是变化的结果。前者定义为自变量(independent variable)以 X 表示,后者称作依变量(dependent variable),以 Y 表示。 相关关系是指两个变量之间不是因果关系,如穗长与穗重的关系。这里没有自变量与依变量之分。 为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 散点图(scatter diagram) 考察具有统计关系的两个变量之间的基本方法。 将两个变数的n对观察值(x1,y1)、 (x2,y2)…… (xn,yn)分别标注在同一坐标图上。 5.2.2 计算过程(例题) 例:合金钢强度(Y)与钢材中碳含量(X)的关系。 5.3 直线回归的分析 5.3.1 计算直线回归方程的方法 5.3.2 回归平方和分解 5.3.3 回归误差 5.3.4 计算例题: 5.3.5 直线回归的数学模型和基本假定 5.3.6 直线回归的假设测验 5.3.7 相关系数(r)与决定系数(R2) 5.3.8 直线回归的区间估计 5.3.9 回归方程的定义阈 5.3.10 相关与回归的关系及应用注意点 简易计算 列出数个方程 y1=a+bx1 y2=a+bx2 …… yn=a+bxn 回归方程a与b值的几种情况: 5.3.2 回归平方和分解: 通过回归方程的误差分析可以对预测的精度有所了解。因变量的波动变化可分为二个部分:一是回归值(y ^)与平均数(y-)的离差;二是观察值(y)与回归值( y ^ )之差,即由x与y线性关系引起的误差。用U表示全部观察点的离差平方和( )用Q表示剩余平方和( ),则: 总 的 平 方 和=U+Q=∑(y-y-)2=lyy =SSy 回归平方和(U)=∑(y^-y-)2=b·lxy=b*SP 剩余平方和(Q)=∑(y-y^)2=lyy-b·lxy 总平方和分解: 5.3.3 回归误差 回归误差(S) 相关系数 决定系数(R2)=U÷lyy 显著性测验可查表可得:R.05= ,R.01= , 例9.1:3月下旬至4月中旬的旬平均温度累计值(x)和水稻一代三化螟盛发期(y)的关系见表。试计算由积温预测盛发期的直线回归方程。 计算回归系数b、回归截距 a 方程图示: 估计回归标准误 5.3.5 直线回归的数学模型和基本假定 直线回归中Y的总体由三部分组成: ①回归截距α;②回归系数β;③随机误差ε。 即 Yj=α+βXj+ε 样本线性组成:yj=a+bxj+ej 回归模型的参数α(截距)、β(斜率)、 误差的方差。 相应的估计值是a、b、S2y/x 。 5.3.6 直线回归的假设测验 目的:确定来自无回归直线回归概率的大小。 一般仍将概率设为0.05或0.01。 t 测验:当总体不存在回归关系时β=0,有回归关系时β≠0。 所以假设:H0: β=0,HA:β≠0 回归系数b的标准误Sb为: 直线回归的假设测验 F测验: F 测验与t 测验的关系 5.3.7 相关系数(r)与决定系数(R2) 相关系数(correlation coefficient)是表示变量X、Y相关程度与性质的标志。 r表示样本的相关系数,是不具单位的量。 相关系数 r 的计算 相关系数 r 的意义 决定系数(R2)的意义 detemination coeffic

您可能关注的文档

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档