- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八讲一回归分析
元线性回归
元曲线回归
三、多元线性回归
些相关关系的例子
少人的身高和体重
父亲的身高和儿子的身高
在农业生产中,小麦的亩产量Y与所施肥量
定把呈现不确定性关系的变量间的联
系称为相关关系
相关关系中的两种变量一类相当于通常
函数关系中的自变量,这类变量能够赋予
个需要的值(如室内的温度、施肥量等),
或能够取到一个可观测但不能人为控制的值
如室外温度),这种变量称为自
或
称
。预报变量的变化能波及另一些
变量(如水稻亩产),这样的变量称为因变
或称应变量
相关关系中的各种变量可以是通变量
可以是随机量。一般把相关关系分为随
机变量间的相关关系和随机变量与普通变
量间的相关关系。这两种情况假设不同,
推导过程也不同,但某些结论却很类似。
本章着重词
。但结论对另
种情况也实用
是处理变量间的相关关系的
种有效工具。其目的在于根据已知预报变
量的变化来估计或预测响应变量的变化情
况,或者根据响应变量来对预报变量做
定的控制。具体来说,它的研究内容如下
它可以提供变量间相关关系的数学表达式
(通常称为经验公式);
且利用概率统计知识,对经验公式及有关问
题进行分析、判断以确定经验公式的有效性。
从众多的预报变量中,判断哪些变量对响应
变量的影响是显著的,哪些是不显著的;
°还可以利用所得经验公式,由一个或几个变
量的值,去预测或控制另一个变量的取值,
同时还可知道这种预测和控制可以达到什么
样的精度。
为了方便,我们将随机变量Y与其取值
表示,而x通常表示普通变量
回归的由来英国著名人类学家 franics
Galton(1822-1911)于1885年在论文
《身高遗传中的平庸回归》中阐述了他的
重大发现:子代的身高有向平均值靠拢的
趋向。因此,他用回归一词来描述子代身
高与父代身高的这种关系。随后,英国著
名统计学家 K. Pearson等人搜集了上千家
庭成员的身高数据,分析出儿子的身高y
与父亲的身高x大致可归结为一下关系:
y=0.516x+3373(单位为英寸
从而进一步证实了 Galton的“回归定律”
这就是回归一词最初在遗传学上的含义。
回归的现代意它要比其原始意义广泛的多。
具体地说,回归分析的内容包括:
确定响应变量与预报变量间的回归模型,即变量
间相关关系的数学表达式(通常称为经验公式);
根据样本估计并检验回归模型及未知参数;
从众多的预报变量中,判断哪些变量对响应变
量的影响是显著的,哪些是不显著的;
根据预报变量的已知值或给定值来估计或预测
响应变量的平均值并给出预测精度或根据响应
变量的给定值来估计预报变量的值,即所谓的
预报与控制问题
定义2设y为随机变量,x为非随机变量
即普通变量,描述y与x的关系的方程称为
回归方程,Eykx)=fx)的图形称为回归曲线
这个图形为直线时,称为
注意:回归曲线有一个取值范围。有时候,
尽管两个变量间不是直线关系,但如限制
在某个范围时仍作为直线关系来处理,是
很有实用价值的。但在作预报时,对于超
出这个范围的预报变量作的预报必须注意
是不可靠的。预报变量不只一个时,也有
类似的情况值得注意。
元线性回归
基本问题
研究随机变量y与普通变量x间的相关关系。
这里对于每个确定的x,y是一个具有确定分
布的随机变量。寻求y的均值与x之间的函数
关系的表达式Ey=以(x)便是回归分析的基本
问题。这里的μ(x)称为y对x的回归函数,或
简称为y对x的回归。
简单而有代表性的情形是,μ(x)与x呈线性
关系,以(x)=ax+b,用线性函数a+bx来估计y的
数学期望的问题,称为一元线性回归问题。
对于x的一组不全相同的值x,x2…,x做独
立试验得到随机变量y的相应的观测值y1,
y2…,yn,这样就得到了n对数据:(x1,y1)x2
y2)…,(xn,yn)我们称之为一组样本容量为
n的样本,我们的任务就是用这组样本来估
计回归函数μ(x)=ax+b的表达式。
散点图。可粗略帮助我们了解应用什么形
式的函数来估计μ(x)如果散点大致成一直
线,就可用ax+b来估计(x)。下面详细介
绍之。
文档评论(0)