回归分析及相关性分析全版可修改.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
12 100 12 100 12 100 12 100 12 100 12 100 12 100 12 100 12 100 12 100 12 100 12 100 12 100 * 回归分析及相关性分析 * 教师信息 教师: 电子信箱: 办公室: : * 上周回忆 * 学习目标 通过案例分析,引入回归分析、相关性分析等统计学概念和理论知识,根本掌握运用Excel工具解决数据处理与分析等商务决策的方法. 掌握回归分析理论及模型建立的方法 理解拟合度等相关参数的意义 掌握相关性分析理论及模型建立的方法 理解相关系数等参数的经济意义 * 回归分析 回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法. 回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析 * 简单回归分析 回归根本上可视为一种拟合过程,即用最恰当的数学方程去拟合一组由一个因变量和一个或多个自变量所组成的原始数据. 最简单的形式是线性回归,它有一个因变量和一个自变量,因此就是用一个线性方程y=a+bx去拟合一系列对变量x和y的数据观察值的过程. * 简单回归分析例如 例如1:一种新牌子化肥的不同施用量对庄稼产量的影响如下表.请你确定当化肥施用量为5.5克时估计预期的产量. 化肥施用量x (克) 0 1 2 3 4 5 6 7 8 9 10 产量 (公斤) 0.21 0.35 0.41 0.46 0.5 0.52 0.53 0.53 0.53 0.51 0.49 * 利用Excel建立线性回归模型 根据数据建立散点图 自变量放在X轴,因变量放在Y轴 简单线性拟合 添加趋势线(类型为“线性〞),选定“显示公式〞和“显示R2值〞 得到趋势线(线性)方程和R2 将X代入方程 X=5.5,Y=0.4701 * 如何衡量直线拟合的程度 如果每一个观察点都落在拟合方程上,那么就会得到一个总分值1(100%). 拟合方程对观察到的原始数据拟合得怎么样? 随着越来越多的观察点偏离拟合直线,分数就会下降,这个分数就叫做R2 ,R2 = 0.5983=59.83%60%,说明方程拟合得不够好,我们从趋势线可以直观地看到此关系不是线性的. * 二次方程拟合 重新添加趋势线(类型为多项式) 结果很明显,拟合程度从线性方程的60%提高到二次方程的97%. 反映出观察到的饱和程度. * 最大利润模型 例如2:假设庄稼以每公斤4元的价格出售,化肥要以每克0.2元的价格购置.请确定能产生最大利润的化肥施用量.(运用规划求解) 总收益=价格×产量=4元×(-0.0066X2+0.0897x+0.2419) 总本钱=化肥本钱×化肥施用量=0.2X * 利用Excel回归路径数据分析 步骤: 加载宏—分析工具库 工具—数据分析—回归 在“回归〞对话框输入X值和Y值的区域 选择“标志〞 确定输出区域 * 数据分析结果 * 多元回归 例如3:假设某种商品的销售量与价格、广告支出、家庭收入有关. 现有35个地区市场的相关数据. 用价格、广告支出和家庭收入对销售量建立一个多元回归模型. 销售量=624.32-40.73*价格+7.10*广告支出+0.50*家庭支出 * 相关性分析 相关性分析是检验衡量两变量关联强度的过程 在统计研究中,常涉及到两个事物(变量)的相互关系问题,例如,学习成绩与非智力因素的关系,数学成绩与物理成绩的关系,男女生学习成绩的关系,等等.其关系表现为以下三种变化; 第一,正相关:一个变量增加或减少时,另一个变量也相应增加或减少; 第二,负相关:一个变量增加或减少时,另一个变量却减少或增加; 第三,无相关:说明两个变量是独立的,即由一个变量值,无法预测另一个变量值. 统计学中,就用“相关系数来从数量上描述两个变量之间的相关程度,用符号“r来表示. * 皮尔森积矩相关系数 Pearson product-moment correlation coefficient * 相关系数表示的意义 相关系数r是对两变量线性相关的测量,数值的范围从-1到0,到+1,表达变量间的相关强度. r值为+1表示两组数完全正相关 r值为-1表示两组数完全负相关,说明它们间存在反向关系,一个变量变大时另外一个就变小 当r值为0时表示两变量之间不存在线性关系 相关系数取值范围限于:-1≤r≤+1 * 利用Excel计算相关系数 Excel中计算相关系数有两种方法 Excel数据分析功能 CORREL()函数 * 利用Excel数据分析计算相关系数 例如4:一般认为联邦债券利率与商品期货指数相关.下表列出了12天里的联邦债券利率与商品期货指数,

文档评论(0)

liuxiaoyu99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档