- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用统计学课件第11章相关分析和 与回归分析.pptx
第11章 相关分析与回归分析11.1、变量间的关系11.2、相关系数的测度11.3、简单线性回归模型11.4、回归模型的应用11.1、变量间的关系1 、函数关系和相关关系 Y=f(x) 变量之间不确定性的依存关系,我们称之为相关关系.2、相关关系的种类例1、 下面是19个家庭食品消费支出和家庭收入数据(数据教材11-1),试用图表分析食品消费支出与家庭收入的相关关系。11.2相关系数的测度1、线性相关系数性质:-1≤r≤+1r0,负相关;r0,正相关;|r|=1完全相关强相关和弱相关t检验的步骤:第一步:提出假设H0: ρ=0 H1: ρ≠0第二步:计算检验统计量值 第三步:根据给定的显著性水平a和自由度查t分布表,得到 临界值ta/2(n-2) 。 若t ta/2(n-2) ,则拒绝原假设。 反之,不能拒绝原假设。例11.2 针对数据11.1,19个家庭食品消费支出和家庭收入数据计算的样本相关系数r=0.9785,检验两者之间的线性相关系数是否显著(a=0.05)。解:第一步:提出假设H0: ρ=0 H1: ρ≠0第二步:计算检验统计量值 第三步:根据给定的显著性水平a和自由度查t分布表,得到 临界值t0.025(17)=2.1098 。 因为t=19.56 ta/2(n-2) ,故拒绝原假设。表明家庭食品支出与家庭收入变量总体上相关性显著。11.3简单线性回归模型11.3.1模型的基本定义 1、模型的数学形式Y:因变量、应变量、被解释变量X:自变量、解释变量2、模型包含随机误差项ε的原因1)引起变量观察值随机误差的诸多因素,使模型产生的误差。变量观察值的误差往往是不可避免的,无论是试验数据还是观察数据。但是在多次观察中有理由认为绝对值相同的正、负误差出现的机会大致相同。2)模型设定的误差。这其中既有模型的函数形式设定的误差,也可能有遗漏解释变量的误差。引起设定误差的原因可能是我们对于引起 变动的机理尚不清楚,有时也是为了简化模型的需要。3)存在一些无法观测的解释变量。3.关于随机误差项ε的假定1)对于ε本身而言,具有零均值,即 E(εi)=0 ;2)对于ε本身而言,具有等方差,即: D(εi)=σ2;3)对于ε本身而言,即εi和εj不相关,可以表示为: COV(εi,εj)=0 ;4) ε与解释变量X不相关,可以表示为: COV(εi,Xj)=0。11.3.2 最小二乘估计法(Least Squares Estimate Method) 1. 最小二乘的基本思想 根据Y 和X的样本观察值得到总体参数的估计值 ,最常用的方法就是最小二乘估计法,即假设在拟合Y依X线性关系的所有直线中,有一条直线的预测值和观察值的偏离程度最小,即:必有:整理得到参数的估计值:在手工计算样本相关系数时,通常先列计算表得到∑X,∑Y,∑XY,∑X2,∑Y2。然后代入公式。例11.3 针对数据11-1,试估计居民食品消费支出依家庭收入的回归方程。通过计算,可以得到食品消费支出依居民家庭收入的样本回归方程,写成:根据经济学的知识,对这一回归方程可以做出解释,斜率0.2537表示当家庭收入每增加1万元,用于居民家庭食品的消费支出平均增加2537元,可以理解为收入对食品支出的边际贡献;而截距1.1782可以理解为收入为0时家庭食品支出额。2. 在EXCEL中回归方程的估计第一步,选择“数据分析”中的“回归”分析工具,选择Y的输入区域和X的输入区域,如图第二步,点击确定后得到如图11-3b的三张表:回归统计、方差分析和系数表(Coefficients)。11.3.3回归方程的显著性检验1.回归方程整体拟合效果的检验——拟合优度(goodness of fit)Y的总变差:回归平方和:残差平方和:对于给定的样本数据,无论样本回归线如何,总变差平方和TSS总是一定的,那么ESS在TSS中所占比重越高,或者说由于随机因素引起的变差RSS所占比重越小,都能够说明根据 解释 的变化效果越好,因此我们定义:称R2为拟合优度(goodness of fit)或判定系数,它度量了回归方程的拟合效果。根据上面相关定义可知,拟合优度的取值[0,1]。2.回归方程线性关系的显著检验——F检验度以例11-3中食品消费支出的回归分析结果为例第一步:提出假设H0:β=0H1:β≠0第二步:计算F统计量第三步:查自由度为(1,17)的F分布临界值,一般情形下,给定显著性水平a=0.05 。 F0.05(1,17)=8.3997第四步:将根据样本回归结果计算的F=382.8091和临界值比较,由于F F0.05(1,17)=8.3997 ,因此拒绝原假设。 P-值检验,F对应的右侧概率。3.回归方程系数的显著检验——t检验度(t-test)t检验的步骤第一步:提出假设第二步:计算
文档评论(0)