- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
1§9.1回归分析的概念§9.2一元线性回归§9.3可线性化的一元非线性回归§9.4单因素试验方差分析回归分析及方差分析Ch9
“回归”一词的历史渊源2“回归”一词最早由FrancisGalton引入。十九世纪,英国生物学家兼统计学家高尔顿研究发现:其中x表示父亲身高,y表示成年儿子的身高(单位:英寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。010302
9.1回归分析的基本概念3010204确定性关系非确定性关系(相关关系)变量之间的关系
对于相关关系,虽然不能求出变量之间精确的函数关系式,但是通过大量的观测数据,可以发现它们之间存在一定的统计规律性。对变量间统计依赖关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的。
回归分析是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。分为:一元线性回归、多元线性回归、可线性化的非线性归(双曲线、指数、对数、二次、幂函数等)
基本方法6考察随机变量Y与普通变量x之间的相关关系.例1.在农业生产中小麦的亩产量Y与所施肥料量x有一定关系,在一定范围内,若施肥量大,亩产也较高。问题:Y是怎样依赖施肥料量x的变化的。问题的特征:x是普通变量,Y是随机变量.处理方法:按数理统计处理问题的方法。
(1)先进行一些试验,分别取不同的值Y也得到个相应观察值得到n对数据对,称为样本数据点(2)散点图Yxo····················
(3)寻找Y与x的数量关系:8,其中01.一般地,01.
例1合金的强度y(×107Pa)与合金中碳的含量x(%)有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi),i=1,2,?,n。本例中,我们收集到12组数据,列于表1中进行回归分析首先是回归函数形式的选择。当只有一个自变量时,通常可采用画散点图的方法进行选择。
表1合金钢强度y与碳含量x的数据10序号x(%)y(×107Pa)序号x(%)y(×107Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.0
为找出两个量间存在的回归函数的形式,可以画一张图:把每一对数(xi,yi)看成直角坐标系中的一个点,在图上画出n个点,称这张图为散点图,见右图。
这便是y关于x的一元线性回归的数据结构式。通常假定在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即显然假定(2)比假定(1)强从散点图我们发现12个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示为
由于?0,?1均未知,需要我们从收集到的数据(xi,yi),i=1,2,…,n,出发进行估计。在收集数据时,我们一般要求观察独立地进行,即假定y1,y2,?,yn,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型:
9.2一元线性回归141.本节考虑的模型是其中都是未知参数,为回归系数,分别是直线的截距和斜率。称为Y关于x的经验回归函数。方程称为Y关于x的经验线性回归方程,或经验回归方程,其相应的图形称为经验回归直线。此模型称为一元线性回归模型,基于此种模型的统计分析称为一元线性回归分析.
的最小二乘估计15其中是对观察时的随机误差.的估计。下面用最小二乘法来求对于自变量x和因变量y的n对观察值
使得成立的和称为和的最小二乘估计。
于是得方程组17
解得01记02于是03
例设某化学过程的得率Y与该过程的温度x有关.现作了10次测量,其数据如下表所示.x/℃38434954606671778288y/%20.420.922.523.024.224.326.226.628.028.9解故于是得线性回归方程
解由此给出回归方程为:例2使用例1种合金钢强度和碳含量数据求回归方程。
残差01残差的平方和03是05显然02定理04的无偏估计。06
所以解 例中已求出例:求出例中误差方差的无偏估计
,则有和相互独立.RSS与定理 对一元线性回归模型(),若进一步假定随机误差
4回归方程的显著性检验2501040203在使用回归方程作进一步的分析以前,首先应对回归方程是否有意义进行判断。如果?1=0,那么不管x如何变化,E(y)不随x的变化作线性变化,那么
文档评论(0)