《SPSS统计分析与应用》教学讲义要素.ppt

  1. 1、本文档共321页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.1.1 SPSS 17.0的新增功能 全新的语法编辑器。 SPSS 17.0对语法编辑器进行了重新设计,语法编辑器增加了自动完成、颜色编码、书签和分界 点等功能,提高了用户的编辑效率。 定制对话框生成器。定制对话框生成器可以满足用户生成命令语法创建和管理定制对话框的操作要求,用户可以从多个命令生成语法,从而实现更强的个性化扩展功能的要求。 增加了多重插补、最近邻元素分析、RFM 分析。最近邻元素分析利用元素相似性实现个案分类的方 法。缺失数据值的多重插补可以在运行其他过程时方便地进行缺失值的处理并获取汇聚结果。RFM分析是一种用于标识最可能对新产品做出反应的现有客户的方法,多用于市场分析和调研。 增强了导出输出功能。 SPSS 17.0提供了 更多的输出导出格式选项和更多导出内容。 1.1.2 SPSS 17.0对运行环境的要求 1.1.3 SPSS 17.0的启动与退出 多元线性回归分析操作 (一)基本操作步骤 (1)菜单选项: analyze-regression-linear… (2)选择一个变量为因变量进入dependent框 (3)选择一个或多个变量为自变量进入independent框 (4)选择多元回归分析的自变量筛选方法: enter:所选变量全部进入回归方程(默认方法) remove:从回归方程中剔除变量 stepwise:逐步筛选;backward:向后筛选;forward:向前筛选 (5)对样本进行筛选(selection variable) 利用满足一定条件的样本数据进行回归分析 (6)指定作图时各数据点的标志变量(case labels) 多元线性回归分析操作 (二) statistics选项 (1)基本统计量输出 Part and partial correlation:与Y的简单相关、偏相关和部分相关 R square change:每个自变量进入方程后R2及F值的变化量 Collinearity dignostics:共线性诊断. 多元线性回归分析操作 (三)options选项: stepping method criteria:逐步筛选法参数设置. use probability of F:以F值相伴概率作为变量进入和剔除方程的标准.一个变量的F值显著性水平小于entry(0.05)则进入方程;大于removal(0.1)则剔除出方程.因此:Entryremoval use F value:以F值作为变量进入(3.84)和剔除(2.71)方程的标准 (四)save选项: 将回归分析结果保存到数据编辑窗口中或某磁盘文件中 线性回归分析中的共线性检测 (一)共线性带来的主要问题 高度的多重共线会使回归系数的标准差随自变量相关性的增大而不断增大,以至使回归系数的置信区间不断增大,造成估计值精度减低. (二)共线性诊断 自变量的容忍度(tolerance)和方差膨胀因子 容忍度:Toli=1-Ri2. 其中: Ri2是自变量xi与方程中其他自变量间的复相关系数的平方. 容忍度越大则与方程中其他自变量的共线性越低,应进入方程. (具有太小容忍度的变量不应进入方程,spss会给出警)(T0.1一般认为具有多重共线性) 方差膨胀因子(VIF):容忍度的倒数 SPSS在回归方程建立过程中不断计算待进入方程自变量的容忍度,并显示目前的最小容忍度 线性回归分析中的共线性检测 (二)共线性诊断 用特征根刻画自变量的方差 如果自变量间确实存在较强的相关关系,那么它们之间必然存在信息重叠,于是可从这些自变量中提取出既能反映自变量信息(方差)又相互独立的因素(成分)来. 从自变量的相关系数矩阵出发,计算相关系数矩阵的特征根,得到相应的若干成分. 如果某个特征根既能够刻画某个自变量方差的较大部分比例(如大于0.7),同时又可以刻画另一个自变量方差的较大部分比例,则表明这两个自变量间存在较强的多重共线性。 条件指标 0k10 无多重共线性; 10=k=100 较强; k=100 严重 线性回归分析中的异方差问题 (一)什么是差异方差 回归模型要求残差序列服从均值为0并具有相同方差的正态分布,即:残差分布幅度不应随自变量或因变量的变化而变化.否则认为出现了异方差现象 (二)举例理解异方差 收入水平和消费种类 打字时间和出错类型 线性回归分析中的异方差问题 (三)差异方差诊断 可以通过绘制标准化残差序列和因变量预测值(或每个自变量)的散点图来识别是否存在异方差 (四)异方差处理 实施方差稳定性变换 残差与yi(预测值)的平方根呈正比:对yi开平方 残差与yi(预测值)呈正比:对yi取对数. 残差与yi(预测值)的平方呈正比,则1/yi 线性回归分析中的异方差问题 (四)异方差处理 利用加权最小二乘法来代

文档评论(0)

此项为空 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档