第4讲评价方法2.pptVIP

下载本文档

8
0
约8.98千字
约 92页
2018-05-27 发布于江西
举报

第4讲评价方法2.ppt

第4讲评价方法2

授课教师：杨励雅中国人民大学公共管理学院城市规划与管理系 2008年11月第一节评价问题概述第二节 AHP法的原理及应用第三节因子（主成分）分析及SPSS操作第四节聚类分析及SPSS操作 1、评价问题的概念 2、指标体系的构建 3、指标的标准化处理 4、指标权重的确定 5、评价方法的选择（1）因子分析的前提条件（2）因子提取（3）使因子更具有命名可解释性（4）计算各样本的因子得分 2. 因子分析的步骤核心（1）因子分析的前提条件通过各种方法分析原有变量是否存在相关关系，是否适用于进行因子分析计算相关系数矩阵：若矩阵大部分元素均小于0.3，则认为不适合进行因子分析。巴特利特球度检验：以原有变量的相关系数矩阵为出发点，提出原假设：相关系数矩阵为对角阵，且主对角元素均为1（即不适合因子分析） KMO检验：比较变量间简单相关系数和偏相关系数的指标大于0.9（非常合适） 0.8（适合）；0.7（一般） 0.6（不太适合）；0.5以下（极不适合）（2）因子提取样本数据因子载荷矩阵某种方法主成分法： ①将原有n个变量数据进行标准化处理； ②计算变量的简单相关系数矩阵R ； ③求R的特征值及对应的特征向量，得到因子载荷矩阵（选取前k个特征值及特征向量）：因子个数k的确定标准： ①选取大于1的特征值（每个特征值为每个因子的方差贡献）； ②绘制特征值的碎石图，选取拐点之前的特征值； ③选取累积方差贡献率大于0.85时的特征根个数为因子个数。第一个因子的累积方差贡献率：前k个因子的累积方差贡献率：（3）使因子更具命名可解释性（因子的命名）若因子载荷aij的绝对值在第j列的多个行上都有较大的取值，则表明因子fj能同时解释多个变量，不能典型代表任何一个原有变量xi，其含义是模糊不清的。可通过因子旋转的方式，使一个变量只在尽可能少的因子上有比较高的载荷。最理想状态下，某个变量xi在某个因子fj上的载荷趋于1，在其他因子上的载荷趋于0 （4）计算各样本的因子得分因子确定以后，需计算各因子在每个样本上的具体数值，这些数值称为因子得分，形成的变量称为因子变量。计算因子得分的途径是用原有变量来描述因子。因子得分函数如下：在后续的分析评价中，就可用因子变量代替原有变量进行数据建模 3. 因子分析的SPSS操作 Analyze → Dimension Reduction → Factor 案例一案例二作业第四节聚类分析法 1. 聚类分析的原理 2. 层次聚类及SPSS操作 3. K-means聚类及SPSS操作 1. 聚类分析的原理概念：聚类分析是一种研究“物以类聚”问题的统计分析方法超市商品分类：根据商品用途、价格档次、产地等多种变量因素进行归类，需要对不同品种之间的关系给出定量化描述，可采用聚类分析的方法。例如：国家分类：早期的“第一世界”、“第二世界”、“第三世界”。当前，国与国之间关系错综复杂，国家分类须考虑国家政体模式、经济发展水平、军事力量对比、民族关系等诸多因素。 1. 聚类分析的原理基本方法：聚类分析是通过将一批样本（或变量）数据的诸多特征，按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类，产生多个分类结果。类内部个体特征具有相似性、不同类之间个体特征差异较大理解聚类分析的关键是理解何谓“没有先验知识”以及“亲疏程度” “没有先验知识”：没有事先指定分类标准，即完全由样本数据出发而形成的分类。下表是同一批客户对经常光顾的5座商厦在购物环境和服务质量两方面的评分，根据这批数据将5座商厦分类 90 94 E商厦 88 91 D商厦 82 84 C商厦 64 66 B商厦 68 73 A商厦服务质量购物环境编号 “亲疏程度”：各变量取值上的总体差异程度，通常通过某种距离来测度（将每个样本数据看成K维空间上的一个点）。个体间距离的定义，因变量类型不同而不同 A 定距型变量个体间距离的计算方式 ①欧式距离（Euclidean distance）两个体（x,y）间的欧式距离是两个体K个变量值之差的平方和的平方根 ②平方欧氏距离（Squared Euclidean distance）两个体（x,y）间的平方欧氏距离是两个体K个变量值之差的平方和 A商厦和B商厦间的欧氏距离 A商厦和B商厦间的平方欧氏距离 ③切比雪夫（Chebychev）距离两个体（x,y）间的切比雪夫距离是两个体K个变量值绝对差的最大值 A商厦和B商厦间的切比雪夫距离 ④Block距离两个体（

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第4讲评价方法2.pptVIP