薛薇《统计分析软件SPSS应用》教学讲义(SPSS18)p316解析.ppt

薛薇《统计分析软件SPSS应用》教学讲义(SPSS18)p316解析.ppt

  1. 1、本文档共316页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
薛薇《统计分析软件SPSS应用》教学讲义(SPSS18)p316解析

线性回归分析中的异方差问题 (一)什么是差异方差 回归模型要求残差序列服从均值为0并具有相同方差的正态分布,即:残差分布幅度不应随自变量或因变量的变化而变化.否则认为出现了异方差现象 (二)举例理解异方差 收入水平和消费种类 打字时间和出错类型 线性回归分析中的异方差问题 (三)差异方差诊断 可以通过绘制标准化残差序列和因变量预测值(或每个自变量)的散点图来识别是否存在异方差 (四)异方差处理 实施方差稳定性变换 残差与yi(预测值)的平方根呈正比:对yi开平方 残差与yi(预测值)呈正比:对yi取对数. 残差与yi(预测值)的平方呈正比,则1/yi 线性回归分析中的异方差问题 (四)异方差处理 利用加权最小二乘法来代替普通最小二乘法估计回归模型参数. 一般:wi=1/δi2 wi=1/xim 实现方式:WSL按钮,指定加权变量(同SPSS的weight estimation权重估计) 曲线估计(curve estimate) (一)目的: 在一元回归分析或时间序列中,因变量与自变量(时间)之间的关系不呈线性关系,但通过适当处理,可以转化为线性模型.可进行曲线估计. (二)曲线估计的常用模型: y=b0+b1t (线性拟和linear) y=b0+b1t+b2t2 (二次曲线quadratic) y=b0+b1t+b2t2+b3t3 (三次曲线cubic) t为时间,也可为某一自变量. 曲线估计(curve estimate) (三)基本操作步骤 (1)绘制散点图,观察并确定模型. (2)菜单选项: analyze-regression-curve estimation (3) 选择因变量到dependent框 (4) 选择自变量到independent框或选time以时间作自变量 (5)选择模型 (R2最高拟和效果最好) 曲线估计(curve estimate) (四)其他选项 (1)display ANOVA table:方差分析表 (2)plot models:绘制观察值和预测值的对比图. (3)save选项: predicted values:保存预测值. Residual:保存残差值. prediction interval:保存预测值的默认95%的可置信区间. Predict case:以time作自变量进行预测. Predict from estimation period through last case:计算保存所有预测值. Predict through :如果预测周期超过了数据文件的最后一个观测期,选择此项,并输入预测期数. 第九章 SPSS的聚类分析 聚类分析概述 概念: 聚类分析是统计学中研究“物以类聚”的一种方法,属多元统计分析方法. 例如:细分市场、消费行为划分 聚类分析是建立一种分类,是将一批样本(或变量)按照在性质上的“亲疏”程度,在没有先验知识的情况下自动进行分类的方法.其中:类内个体具有较高的相似性,类间的差异性较大. 聚类分析概述 两类:(A B) (C D E) 三类:(A B) (C) (D E) 依据平均得分的差距,差距较小的为一类. 分类过程中,没有事先指定分类的标准.完全根据样本数据客观产生分类结果. 亲疏远程度的衡量指标 相似性:数据间相似程度的度量 距离: 数据间差异程度的度量.距离越近,越“亲密”,聚成一类;距离越远,越“疏远”,分别属于不同的类 定距型个体间的距离: 把每个个案数据看成是n维空间上的点,在点和点之间定义某种距离.一般适用于定距数据 欧氏距离(EUCLID) 平方欧氏距离(SEUCLID) 聚类分析概述 个体距离矩阵 定距型个体间的距离 聚类分析概述 品质型个体间的距离 姓名 授课方式 上机时间 选某门课程 张三 1 1 1 李四 1 1 0 王五 0 0 1 聚类分析概述 品质型个体间的距离 简单匹配(simple matching)系数:适用二值变量。 个体j 个体i 1 0 1 a b 0 c d a为个体i与个体j在所有变量上同时取1的个数;d为同时取0的个数 特点:排除同时拥有或同时不拥有某特征的情况;取0和1地位等价,编码方案

文档评论(0)

little28 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档