统计学A第9章相关与回归.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;第1节 相关的概念和种类;3;4;2 相关的种类;(2)按相关的形式分;3 相关分析的主要内容(任务): ;第二节 直线相关分析;商店;10;双变量分组相关表;二 相关系数(correlation coefficient);;若相关系数是根据样本数据计算的,则称为样本相关系数,记为 r;如果定义:;;根据计算结果可知:;年份;解:根据样本相关系数的计算公式有;(二)相关系数的性质;-1.0;(三)相关系数的缺点;(四)用相关系数分析相关关系时应注意的问题;24;(二)检验的步骤;(1)提出假设:H0:? ? ? ;H1: ? ? 0 (2)计算检验的统计量:;27;回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式(数学模型),近似地描述变量间的平均变化关系,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。;二 回归的种类;回归模型的类型;31;32;33;通过求a、b的一阶偏导可得到求解a、b的联立方程:;4544.6;则回归方程为:; 【例9.5】根据例9.2中的数据,配合销售额与广告费的回归方程 根据a和b的求解公式得;运用INTERCEPT函数 计算截距;(五)用Excel进行回归分析;;R square称为方程的确定系数,0~1之间,越接近1,表明方程的变量对y的解释能力越强。 对于回归方程来说,总结了以下几个意义: 1.R square可以作为选择不同模型的标准。如果在拟合数据之前,不能确定数据到底是什么模型,那么可以对变量的不同数学形式进行拟合,然后看R square的大小,R square大的模型,说明这个模型对数据拟合的较好。 2.在数据的关系存在非线性可能情况下: (a)不一定R square越大拟合越好,因为R square只是回归平方和占总平方和的比例。比如,在那四幅著名的图里面,R square都等于66%,并且都是线性拟合,但是他们的数据点完全不同,有些是因为特异案例的存在,致使数据拟合出来是线性的,而事实上并非如此。所以,应该在拟合之前观察散点图,然后去掉特异值.;(b)如果一个模型的R square很小,不一定代表数据之间没有关系,而很有可能是选择的模型不对,因为数据之间也许的其他的函数关系,比如对数关系或者指数关系。这意味着需要对数据作进一步的拟合。(当然,最好的方法应该是在数据拟合之前先观察散点图)。如果是线性模型,那么R square才是方程拟合优度的度量,R square越大,回归方程拟合数据越好,线性关系越强。;3.当自变量个数增加时,尽管有的自变量与y的线性关系不显著,R square也会增大。R square受自变量个数与样本规模影响。对于这点,采用Adjusted R square进行调整。 4.当想确定方程中的每一个自变量对y的边际解释能力时,应该确定每个自变量的偏确定系数(partial coefficient of determination)。注意,偏确定系数反映的是新加入回归的变量所解释的百分比,而这百分比是以前一步回归所未能解释的部分为整体,而不是以y的总变化为整体。也就是说,x1与x2共同解释的y的贡献,已包含在x1解释的y的贡献里面。偏确定系数的意义是,用于判断自变量的重要性。但是,在遇到虚拟变量时,计算这个的意义不大。;显著性水平 ?显著性水平是估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用α表示。显著性是对差异的程度而言的,程度不同说明引起变动的原因也有不同:一类是条件差异,一类是随机差异。它是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。;Excel输出的部分回归结果; 670;答案:相关系数 r = 0.98 b = 0.24 a = -1.13 yc = -1.13+0.24x;四 回归系数与相关系数的关系;五 回归分析与相关分析的关系;第四节 估计标准误差;第四节 估计标准误差;53; 另一个是随机因素的影响,即除自变量 x 对 y 的影响外,其他随机因素所引起的 y 的变动,这种变动可以由 表示,称之为剩余变差。三者关系是:;55; 两端平方后求和有;(二)三个平方和的意义;58;59;Excel的输出结果;(四)判定系数 r2的性质;第四节 估计标准误差;第四节 估计标准误差;第四节 估计标准误差;第四节 估计标准误差;一 线性关系的检验;SST、SSR、SSE的自由度;1、提出假设 H0: b=0,销售额和广告费之间的线性关系不

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档