第4讲评价方法2.pptVIP

  • 8
  • 0
  • 约8.98千字
  • 约 92页
  • 2018-05-27 发布于江西
  • 举报
第4讲评价方法2

授课教师:杨励雅 中国人民大学公共管理学院城市规划与管理系 2008年11月 第一节 评价问题概述 第二节 AHP法的原理及应用 第三节 因子(主成分)分析及SPSS操作 第四节 聚类分析及SPSS操作 1、评价问题的概念 2、指标体系的构建 3、指标的标准化处理 4、指标权重的确定 5、评价方法的选择 (1)因子分析的前提条件 (2)因子提取 (3)使因子更具有命名可解释性 (4)计算各样本的因子得分 2. 因子分析的步骤 核心 (1)因子分析的前提条件 通过各种方法分析原有变量是否存在相关关系,是否适用于进行因子分析 计算相关系数矩阵:若矩阵大部分元素均小于0.3, 则认为不适合进行因子分析。 巴特利特球度检验:以原有变量的相关系数矩阵为出发 点,提出原假设:相关系数矩阵为对角阵,且主对角元素均为1(即不适合因子分析) KMO检验:比较变量间简单相关系数和偏相关系数的指标 大于0.9(非常合适) 0.8(适合);0.7(一般) 0.6(不太适合);0.5以下(极不适合) (2)因子提取 样本数据 因子载荷矩阵 某种方法 主成分法: ①将原有n个变量数据进行标准化处理; ②计算变量的简单相关系数矩阵R ; ③求R的特征值 及对应的特征向量 ,得到因子载荷矩阵(选取前k个特征值及特征向量): 因子个数k的确定标准: ①选取大于1的特征值(每个特征值为每个因子的方差贡献); ②绘制特征值的碎石图,选取拐点之前的特征值; ③选取累积方差贡献率大于0.85时的特征根个数为因子个数。 第一个因子的累积方差贡献率: 前k个因子的累积方差贡献率: (3)使因子更具命名可解释性(因子的命名) 若因子载荷aij的绝对值在第j列的多个行上都有较大的取值,则表明因子fj能同时解释多个变量,不能典型代表任何一个原有变量xi,其含义是模糊不清的。 可通过因子旋转的方式,使一个变量只在尽可能少的因子上有比较高的载荷。 最理想状态下,某个变量xi在某个因子fj上的载荷趋于1,在其他因子上的载荷趋于0 (4)计算各样本的因子得分 因子确定以后,需计算各因子在每个样本上的具体数值,这些数值称为因子得分,形成的变量称为因子变量。 计算因子得分的途径是用原有变量来描述因子。因子得分函数如下: 在后续的分析评价中,就可用因子变量代替原有变量进行数据建模 3. 因子分析的SPSS操作 Analyze → Dimension Reduction → Factor 案例一 案例二 作业 第四节 聚类分析法 1. 聚类分析的原理 2. 层次聚类及SPSS操作 3. K-means聚类及SPSS操作 1. 聚类分析的原理 概念:聚类分析是一种研究“物以类聚”问题的统计分析方法 超市商品分类:根据商品用途、价格档次、产地等多种变量因素进行归类,需要对不同品种之间的关系给出定量化描述,可采用聚类分析的方法。 例如: 国家分类:早期的“第一世界”、“第二世界”、“第三世界”。当前,国与国之间关系错综复杂,国家分类须考虑国家政体模式、经济发展水平、军事力量对比、民族关系等诸多因素。 1. 聚类分析的原理 基本方法:聚类分析是通过将一批样本(或变量)数据的诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。 类内部个体特征具有相似性、不同类之间个体特征差异较大 理解聚类分析的关键是理解何谓“没有先验知识”以及“亲疏程度” “没有先验知识”:没有事先指定分类标准,即完全由样本数据出发而形成的分类。 下表是同一批客户对经常光顾的5座商厦在购物环境和服务质量两方面的评分,根据这批数据将5座商厦分类 90 94 E商厦 88 91 D商厦 82 84 C商厦 64 66 B商厦 68 73 A商厦 服务质量 购物环境 编号 “亲疏程度”:各变量取值上的总体差异程度,通常通过某种距离来测度(将每个样本数据看成K维空间上的一个点)。 个体间距离的定义,因变量类型不同而不同 A 定距型变量个体间距离的计算方式 ①欧式距离(Euclidean distance) 两个体(x,y)间的欧式距离是两个体K个变量值之差的平方和的平方根 ②平方欧氏距离(Squared Euclidean distance) 两个体(x,y)间的平方欧氏距离是两个体K个变量值之差的平方和 A商厦和B商厦间的欧氏距离 A商厦和B商厦间的平方欧氏距离 ③切比雪夫(Chebychev)距离 两个体(x,y)间的切比雪夫距离是两个体K个变量值绝对差的最大值 A商厦和B商厦间的切比雪夫距离 ④Block距离 两个体(

文档评论(0)

1亿VIP精品文档

相关文档