- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实际上,60.316kg是身高为172cm的女大 学生的平均体重的估计值,而不一定是这位 身高172cm的女大学生的真实体重。也就是 说,身高为172cm的女大学生的平均体重 大约是60.316kg,并且大部分172cm的女大 学生的体重在60.316kg附近。 原因:由于所有的样本点不共线,而只是散布 在某一条直线的附近,所以用身高和体重会产 生误差。 这样线性回归模型的完整表达式为 随机误差e的方差越小,用bx+a预报真实值y的精度越高。 由于随机误差e的均值为0.故采用方差来衡量 随机误差的大小。 在线性回归模型 y=bx+a+e 中,y的值由x和随机误差e共同确定,即x只能 解释部分y的变化,因此,我们把x称为解释变量, 把y称为预报变量. 当随机误差e恒等于0时,线性回归模型就变 成一次函数模型。即: 一次函数模型是线性回归模型的特殊形式。 例如:编号为6的女大学生,计算随机误差的 效应(残差) 61-(0.849×165-85.712)=6.627 思考 如何发现数据中的错误?如何衡量模型的拟合效果 . , , , . , ; , , . , 6 1 , 3 1 . 1 越高 回归方程的预报精确度 拟合精度越高 说明模型 区域的宽度越窄 均匀地落在水平的带状 残差点比较 另外 则需要寻找其他的原因 没有错误 如果数据采集 合数据 归模型拟 性回 利用线 然后再重新 予以纠正 就 果数据采集有错误 如 是否有人为的错误 点的过程中 两个样本 需要确认在采集这 大 个样本点的残差比较 个样本点和第 第 出 中可以看 从图 - 已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据: 【变式2】 x 14 16 18 20 22 y 12 10 7 5 3 求y对x的回归直线方程,并说明回归模型拟合效果的好坏. 题型二 线性回归分析 0 0.3 -0.4 -0.1 0.2 4.6 2.6 -0.4 -2.4 -4.4 练习:在一化学反应过程中,化学物质的反应速度 y(g/min)与一种催化剂的量x(g)有关,现收集了 8组观测数据列于表中: 催化剂的量x(g) 15 18 21 24 27 30 33 36 化学物质的反应速度y(g/min) 6 8 30 27 70 205 65 350 试建立y与x之间的回归方程. 作业:P90习题3.1第3题 某班5名学生的数学和物理成绩如下表: 【练习】 学生 学科 A B C D E 数学成绩(x) 88 76 73 66 63 物理成绩(y) 78 65 71 64 61 (1)画出散点图; (2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. [思路探索] 先利用散点图分析物理成绩与数学成绩是否线性相关,若相关再利用线性回归模型求解. 解 (1)散点图如图. 所以y对x的回归直线方程是 =0.625x+22.05. (3)x=96,则 =0.625×96+22.05≈82, 即可以预测他的物理成绩是82. 规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析. (2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义. 3.1 回归分析的基本思想及其初步应用 问题1:正方形的面积y与正方形的边长x之间的函数关系是 y = x2 确定性关系 问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系? 变量之间的两种关系 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 定义: 注:(1)相关关系是一种不确定性关系; (2)对具有相关关系的两个变量进行统计分析的方法叫回归分析. 10 20 30 40 50 500 450 400 350 300 · · · · · · · 施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455 x y 施化肥量 水稻产量 思考1:水稻产量y与施肥量x之间大致有何规律? 散点图 发现:图中各点,大致分布在某条直线附近. 思考2:在这些点附近可画不止一条直线,哪条直线最能代表x与y之间的关系
文档评论(0)