- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工程科技]现代统计分析方法与应用第4章:一元线性回归
第4章 一元线性回归 一元线性回归模型 回归参β0、β1的估计 最小二乘估计的性质 回归方程的显著性检验 残差分析 预测和控制 建模总结和应注意的问题 上述均是研究两个变量之间的关系,而且他们的一个共同特点是:两个变量之间有密切的关系,但他们之间密切的程度并不能由一个变量唯一确定另一个变量。 利用x和残差作散点图: 从残差图上看出,残差是围绕e=0.0000随机波动,从而模型的基本假定是满足的。 按Graphs→Scatters/Dot顺序逐一单击鼠标,选择“残差、化肥施用量”后,点击[Ok]系统出现如下图形: 二、有关残差的性质 性质1: 性质2: 三、残差的改进 标准化残差: 学生化残差: 其中: 标准化残差使残差具有可比性,|ZREi|3的相应观测值即判定为异常值,这简化了判定工作,但是没有解决方差不等的问题。学生化残差则进一步解决了方差不等的问题,因而在寻找异常值时,用学生化残差优于用普通残差,认为|SREi|3的相应观测值为异常值。 在SPSS中: *ZPRED—标准化预测值; *ZRSID—标准化残差; *DRESID—剔除残差; *ADJPRED—修正后预测值; *SRSID—学生化残差; *SDRESID—学生化剔除残差。 第六节 预测 一、单值预测 单值预测就是用单个值作为因变量新值的预测值。 二、区间预测 区间预测也就是对于给定的显著性水平α,找一个区间(T1,T2),使对应于某特定的x0的实际值y0以1-α的概率被区间(T1,T2)所包含,用式子表示,就是: 对因变量的区间预测又分为两种情况,一种是对因变量新值的区间预测;另一种是对因变量新值的平均值的区间预测。 1、因变量新值的区间预测 在正态假定下 遵从正态分布,其期望值为: 为了给出新值y0的置信区间,需要首先求出其估计值 的分布。 由于 与 都是y1、y2、…、yn的线性组合,因而 也是y1、y2、…、yn的线性组合, 因而有: 从而得: 记: 以下计算方差: 则上式简写为: 是用先前独立观测到的随机变量y1,y2,…,yn的线性组合,现在小麦产量的新值y0与先前的观测值是独立的,所以y0与 是独立的。因而: 再由 ,于是: 进而可知统计量: 可得: 由此可以得到y0的置信概率为1-α的置信区间为: 当样本容量n较大, 较小时,h00接近零,y0的95%的置信区间为: 2、因变量新值的平均值的区间估计 上面给出的是因变量单个新值的置信区间,现在关心的是因变量新值的平均值的区间估计,对于前面提出的小麦产量问题,如果该地区的一大片麦地每亩施肥量同为x0,那么这一大片地小麦的平均亩产如何估计呢? 这个问题就是要估计的平均值E(y0)的置信区间,根据前面的公式可知: 由此可以得到y0的置信概率为1-α的置信区间为: 第七节 建模总结和应注意的问题 一、一元线性回归模型从建模到应用的全过程 第一步:提出因变量与自变量。这里以例4.2的数据为例,本例因变量y为全国人均消费金额(元),自变量x为人均国民收入GNP(元),采用年份数据。 第二步:搜集数据。从《中国统计年鉴》得表5.2。 第三步:根据表5.2的数据画散点图。 * 第四步:设定理论模型。由散点图可以看到,随着人均国民收入的增加,居民人均消费额增大,而且20个样本点大致分布在一条直线的周围。因此,我们用直线回归模型去描述它们是合适的。故可以采用一元线性回归理论模型。 第五步:用软件计算,输出计算结果。 §4.7 建模总结和应注意的问题 * 第一节 一元线性回归模型 一、一元线性回归模型的实际背景 在实际问题的研究中,经常需要研究某一现象与影响它的某一最主要因素的影响。如:研究粮食产量与施肥量之间的关系;研究国民收入与消费额之间的关系;研究火灾损失与火灾发生地距最近消防站的距离之间的关系。 为直观地发现n组样本数据(xi,yi)的分布规律,通常把(xi,yi)看成是平面直角坐标系中的点,画出n个样本的散点图。 [例4.1] 现有20组粮食产量与化肥施用量的数据如下表: 表示成散点图如下: [例4.2] 我国1986-2005年全国人均消费额与人均国民收入数据如下表: 表示成散点图如下: 二、一元线性回模型的数学形式 考虑两个变量间的关系,描述上述x与y间线性关系的数学结构通常用下式表示: 上式(*)中y为因变量(被解释变量),x为自变量(解释变量) ,β0和β
您可能关注的文档
最近下载
- 大学生个人简历表格空白模板通用.docx
- 23S516混凝土排水管道基础及接口图集.pdf VIP
- (完整版)《小型露天采石场安全生产标准化评分办法》.pdf
- 砌筑砂浆配合比设计规程.docx VIP
- 医院物业后勤化管理重点部位强化清洁方案及消毒隔离措施方案.docx
- 增量学习与类增长的融合.pptx
- 可编程逻辑控制器(PLC)系列:Siemens S7-1200 (煤炭工业应用)_(11).项目案例分析:矿井提升机控制.docx
- 课题申报书:大学生“慢就业缓就业”心理成因及干预对策研究.docx VIP
- PROE-Program程序设计全解析.doc VIP
- 2014抗爆、泄爆门窗及屋盖、墙体建筑构造14J938.docx
文档评论(0)