第四章 相关分析和.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 相关分析和

第四章 相关分析和回归分析 相关分析和回归分析 第一节 地理要素间的相关分析 第二节 地理要素间的回归分析 第一节 地理要素间的相关分析 为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。 它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 ★正相关 ★负相关 ★完全正相关 ★完全负相关 ★零相关 使用简单相关系数时的注意事项 ● 和 都是相互对称的随机变量 ●?线性相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系 ●?样本相关系数是总体相关系数的样本估计值,由 于抽样波动,样本相关系数是个随机变量,其统 计显著性有待检验 ● 相关系数只能反映线性相关程度,不能确定因果 关系,不能说明相关关系具体接近哪条直线 2.复相关系数的计算与检验 复相关系数:反映几个要素与某一个要素之间的复相关程度 。 复相关系数的计算 当有两个自变量时 当有三个自变量时 例题:在上例中,若以x4为因变量,x1,x2,x3为自变量,试计算x4与x1,x2,x3之间的复相关系数。 第二节 地理要素间的回归分析 3、回归分析的目的 ②总变差的分解 分析Y 的观测值、估计值与平均值的关系 将上式两边平方加总,可证得 (TSS) (ESS) (RSS) 总变差 (TSS):因变量Y的观测值与其平均值的离差平方和(总平方和) 解释了的变差 (ESS):因变量Y的估计值与其平均值的离差平方和(回归平方和) 剩余平方和 (RSS):因变量观测值与估计值之差的平方和(未解释的平方和) ③可决系数 以TSS同除总变差等式两边: 或 定义:回归平方和(解释了的变差ESS) 在总变 差(TSS) 中所占的比重称为可决系数,用 表示: 或 作用:可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观测值的拟合程度越差。 特点:●可决系数取值范围: ●随抽样波动,样本可决系数 是随抽样 而变动的随机变量 ●可决系数是非负的统计 可决系数与相关系数的关系 a联系 数值上,可决系数等于因变量与自变量之间简单相关系数的平方: 可决系数与相关系数的关系 基本思想 在多元回归中有多个解释变量,需要说明所有解 释变量联合起来对应变量影响的总显著性或整个 方程总的联合显著性。对方程总显著性检验需要 在方差分析的基础上进行F检验。 总变差 自由度 模型解释了的变差 自由度 剩余变差 自由度 变差来源 平方和 自由度 方差 归于回归模型 归于剩余 总变差 2、多元线性回归模型的矩阵表示 K个解释变量的多元线性回归模型的n个观测 样本,可表示为 非线性关系线性化的几种情况 对于指数曲线 ,令 , 可以将其转化为直线形式: , 其中, ; 对于对数曲线 ,令 , ,可以将其转化为直线形式: ; 对于幂函数曲线 ,令 , ,可以将其转化为直线形式: 其中, ; k元线性回归模型为 由最小二乘法 …, 3、 最小二乘法确定回归模型 方程组式称为正规方程组。 引入矩阵 则正规方程组式可以进一步写成矩阵形式 (三)多元线性回归模型的检验 1、判定系数检验 调整判定系数 2、回归系数显著性检验 式中 是回归系数 的标准差, 是矩阵 中第j行第j列的元素 给定显著性水平 ,查自由度为n-k-1的 t 分布表得 临界值 根据统计知识可知 服从自由度为n-k-1的 分布 用样本计算 t 的值 若: 认为 之间有线性关系 若: 认为 之间无线性关系 3、回归方程的显著性检验 假设 服从自由度为 , 的 分布,对于给定的显著性水平 ,可以通过 分布表查得显著性水平为 、自由度分别为 、 的临界值 1 若 〉 ,则否定假设,回归方程总体线性关系的显著性检验通过, 将 值与临界值 比较 2 若 〈 ,则接受假设,回归方程总体线性关系的显著性检验未通过, 某市近几年的工农业总产值与社会商品的零售额资料如表 工农业总产值与社会商品的零售额资料表 1、确定商品零售额与工业总产值、农业总产值的回归模型 多元回归相关数据计算表 将表中的数据代入回归方程 2、 模型检验 1 判定系数检验 2 回归系数显著性检验 则参数的 检验通过。 给定显著性水平 ,查自由度为 的 分布临界值 。 因为 3 回归方程的显著性检验 给定显著性水平 ,查自由度为 、 的 分布临界值 ,因为 , 即 模型的 检验通过,回归方程的线性回归效果显著。 4、利用回归模型进行预测

文档评论(0)

2232文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档