第四章相关和范例.ppt

第四章 相关分析和回归分析 相关分析和回归分析 第一节 地理要素间的相关分析 第二节 地理要素间的回归分析 第一节 地理要素间的相关分析 为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。 它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 ★正相关 ★负相关 ★完全正相关 ★完全负相关 ★零相关 使用简单相关系数时的注意事项 ● 和 都是相互对称的随机变量 ●?线性相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系 ●?样本相关系数是总体相关系数的样本估计值,由 于抽样波动,样本相关系数是个随机变量,其统 计显著性有待检验 ● 相关系数只能反映线性相关程度,不能确定因果 关系,不能说明相关关系具体接近哪条直线 2.复相关系数的计算与检验 复相关系数:反映几个要素与某一个要素之间的复相关程度 。 复相关系数的计算 当有两个自变量时 当有三个自变量时 例题:在上例中,若以x4为因变量,x1,x2,x3为自变量,试计算x4与x1,x2,x3之间的复相关系数。 第二节 地理要素间的回归分析 3、回归分析的目的 ②总变差的分解 分析Y 的观测值、估计值与平均值的关系 将上式两边平方加总,可证得 (TSS) (ESS) (RSS) 总变差 (TSS):因变量Y的观测值与其平均值的离差平方和(总平方和) 解释了的变差 (ESS):因变量Y的估计值与其平均值的离差平方和(回归平方和) 剩余平方和 (RSS):因变量观测值与估计值之差的平方和(未解释的平方和)                                                                                                            ③可决系数 以TSS同除总变差等式两边: 或 定义:回归平方和(解释了的变差ESS) 在总变 差(TSS) 中所占的比重称为可决系数,用 表示: 或 作用:可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观测值的拟合程度越差。 特点:●可决系数取值范围: ●随抽样波动,样本可决系数 是随抽样 而变动的随机变量 ●可决系数是非负的统计 可决系数与相关系数的关系 a联系 数值上,可决系数等于因变量与自变量之间简单相关系数的平方: 可决系数与相关系数的关系 基本思想 在多元回归中有多个解释变量,需要说明所有解 释变量联合起来对应变量影响的总显著性或整个 方程总的联合显著性。对方程总显著性检验需要 在方差分析的基础上进行F检验。 总变差 自由度 模型解释了的变差 自由度 剩余变差 自由度 变差来源 平方和

文档评论(0)

1亿VIP精品文档

相关文档