大数据课程学习.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据课程学习.ppt

All Free All Free 回归分析原理及实例 姓名 #01 回归分析法概念及原理介绍 #02 运用SPSS进行回归分析的步骤 #03 对电动自行车与事故率关系的回归分析 利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法。 回归分析定义 1. 根据因变量和自变量的个数来分类: 一元回归分析;多元回归分析; 2. 根据因变量和自变量的函数表达式来分类: 线性回归分析;非线性回归分析; 回归分析分类 可以分为确定关系和不确定关系。但是不论是确定关系或者不确定关系,只要有相关关系,都可以选择一适当的数学关系式,用以说明一个或几个变量变动时,另一变量或几个变量平均变动的情况。 一、相关关系 方差分析的主要思想是把 yi 的总方差进行分解: 模型平方和 误差平方和 二、多元线性回归 1参数估计方法——最小二乘法 2回归方程显著性的检验——就是检验以下假设是否成立(采用方差分析法): 如果自变量对Y的影响显著,则总方差主要应由xi引起,也就是原假设不成立,从而检验统计量为: 方差来源 自由度 平方和 均方 F p值 自变量 m MSS MMS MMS —— EMS p 随机误差 n-m-1 ESS EMS 和 n-1 TSS 多元线性回归的方差分析表: 在实际问题中,影响因变量Y的因素(自变量)可能很多。在回归方程中,如果漏掉了重要因素,则会产生大的偏差;但如果回归式中包含的因素太多,则不仅使用不便,且可能影响预测精度。如何选择适当的变量,建立最优的回归方程呢? 在最优的方程中,所有变量对因变量Y的影响都应该是显著的,而所有对Y影响不显著的变量都不包含在方程中。选择方法主要有: 逐步筛选法(STEPWISE) (最常用) 向前引入法(FORWARD) 向后剔除法(BACKWARD)等 三、逐步回归——变量选择问题 开始 对不在方程中的变 量考虑能否引入? 引入变量 能 对已在方程中的变 量考虑能否剔除? 能 剔除变量 否 筛选结束 否 逐步回归的基本思想和步骤: 某地区大春粮食产量 y 和大春粮食播种面积x1、化肥用量x2、肥猪发展头数x3、水稻抽穗扬花期降雨量x4的数据如下表,寻求大春粮食产量的预报模型。 例2、大春粮食产量的预报模型 1按Graphs→Scatter →Simple顺序展开对话框 2将y选入Y Axis,然后将其余变量逐个选入X Axis ,绘出散点图,观察是否适宜用线性方程来拟合。 1.初步分析(作图观察) 1)按Statistics→Regression →Linear顺序展开对话框 2)将y作为因变量选入Dependent框中,然后将其余变量选入作为自变量选入Independent(s)框中 3)Method框中选择Stepwise(逐步回归)作为分析方式 4)单击Statistics按钮,进行需要的选择,单击Continue返回 5)单击OK按钮执行 2. 回归模型的建立 被引入与被剔除的变量 回归方程模型编号 引入回归方程的自变量名称 从回归方程被剔除的自变量名称 回归方程中引入或剔除自变量的依据 3. 结果分析 由复相关系数R=0.982说明该预报模型高度显著,可用于该地区大春粮食产量的短期预报 常用统计量 方差分析表 回归方程为: 按常识理解,粮食产量和播种面积关系密切,但预报模型中,变量x1未引入,这是因为: 多年来该地区的大春粮食播种面积变化甚微,近于常数,因而对产量的影响不大而失去其重要性。 回归系数分析 在实际问题中,常会遇到变量之间关系不是线性的相关关系,而是某种曲线的非线性相关关系。此时首先要确定回归函数的类型,其原则是: 1 根据问题的专业知识或经验确定 2 根据观测数据的散点图确定 常选曲线类型: 双曲线、幂函数曲线、对数曲线、指数曲线、倒数指数曲线、S形曲线 三、非线性回归 测量13个样品中某种金属含量Y与该样品采集点距中心观测点的距离X,有如下观测值: xi 2 3 4 5 7 8 10 yi 106.42 108.20 109.58 109.50 110.00 109.93 110.49 xi 11 14 15 16 18 19 yi 110.59 106.62 110.90 110.76 111.00 111.20 求Y关于X的关系式。 例. 通过点击右键观看选择适当的类型:Logarithmic 操作步骤:Analyze→Regression →Curve Estimation… 结果如右: 由图易知,结果方程与之前所给的结果有差距 例:电动自行车车速与事故率的关系

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档