- 4
- 0
- 约6.82千字
- 约 18页
- 2017-06-11 发布于北京
- 举报
多元数据处理
---因子分析方法
多元数据处理主要包括多元随机变量,协方差分析,趋势面分析,聚类分析,判别分析,主成分分析,因子分析,典型相关分析,回归分析以及各个分析方法的相互结合等等。本文主要针对其中的因子分析方法展开了论述,并举了一个因子分析法在我国房地产市场绩效评价中的应用实例。
第一章 因子分析方法概述
1.1因子分析的涵义
为了更全面和准确的测量和评估对象的特征,在实际的应用中,我们往往尽可能多的选用特征指标进行系统评估,选取的指标越多,就越能全面、客观的反映评价对象的特征。选取众多指标的同时也带来了统计分析的困难:一、不同的指标,不同重要程度需要赋予不同的权重,而靠主观的评价避免不了一些失误与错误。二、收集到的指标之间可能存在较大的相关性,大量收集指标带来了人力、物力和财力的浪费。而因子分析方法则较好的解决了上述问题。
因子分析[1]是一种多元统计方法,该方法起源于20世纪初 Karl Pearson 和 Charles Spearman 等人关于心理测试的统计分析,它的核心是用最少的相互独立的因子反映原有变量的绝大部分信息。[2]通过分析事物内部的因果关系来找出其主要矛盾,找出事物内在的基本规律。
因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但是,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,使不同组内的变量相关性较低[3]。对于所研究的问题就可试图用最少个数的所谓因子的线性函数与特殊因子之和来描述原来观测的每一变量[4]。因子变量的特点:第一,因子变量的数量远小于原指标的数量,对因子变量的分析能够减少分析的工作量;第二,因子变量不是原有变量的简单取舍,而是对原有变量的重新组构,他们能够反映原有变量的绝大部分信息,不会产生丢失;第三,因子变量之间线性相关性较低;第四,因子变量具有命名解释性[5]。因子分析可以消除指标间的信息重叠,抽象出事物的本质属性,不仅可以综合评价,还可以综合分析对其产生影响的主要因素。
1.2因子分析统计模型
设p个可以观测的指标为,m个不可观测的因子为 ,则因子分析模型描述如下:[6] [7]
其中:mp
是不可测的向量,我们把F称为X的公共因子,其均值向量 E(F)=0,协方差矩阵Cov(F)=1,即向量的各分量是相互独立的是特殊因子,与F相互独立,且E(e)=0。
,为因子载荷,数学上可以证明,因子载荷就是第 i 指标与第 j因子的相关系数,载荷越大,说明第j个指标与第i个因子的关系越密切;反之载荷越小,关系越疏远[8]。
1.3因子分析步骤
(1)原始数据的标准化
原始数据的标准化包括指标正向化合和无量纲化处理两方面。在多指标的评价中,有些指标数值越大,评价越好;有些指标数值越小,评价越好,这种指标称为逆向指标;还有些指标数值越靠近某个具体数值越好,这种指标称为适度指标。根据不同类型的指标需要将逆向指标、适度指标转化为正向指标,此过程称为指标的正向化。指标正向化过程既可以在无量纲化前处理也可以在无量纲化时处理。逆向指标可以选用公式。其中,、分别为指标的最大与最小值。适度指标方面,叶宗裕[9]认为正向化可以采用指标值减去适度值的绝对值的相反数。公式为。其中为正向后数据,为原始数据,M为适度值。指标的无量纲化则是通过标准化处理,将不同的指标通过数学变换转化为统一的相对值,消除各个指标不同量纲的影响。常用的无量纲化包括:标准化法、均值法和极差正规化法。本文采用最常见的标准化法进行无量纲化处理,公式处理如下:(是X的期望值,是 X 的标准差)
(2)计算相关矩阵 R 的特征值和特征向量
根据特征方程,计算相关相关矩阵的特征值及对应的特征向量A,的大小描述了各个因子在解释对象所起的作用的大小。
计算因子贡献率及累积贡献率,确定公共因子个数
因子贡献率表示每个因子的变异程度占所有因子变异程度的比率,公式为:
,表示方差贡献率。当累积贡献率达到85%以上或者特征根不小于1,即确定了公因子的个数。
(4)求解初始因子载荷矩阵
X=AF,因子载荷矩阵A并不唯一,软件则是运用不同的参数估计方法求出相应的估计矩阵,参数估计方法主要包括:最小平方法、极大似然法、主成分法、主因子法、多元回归法。
(5)因子载荷矩阵的旋转
若因子载荷较为平均,初始的因子载荷矩阵描述的经济含义不太明显,难以判断与各个因子的关系时,就需要进行因子旋转。通过因子旋转,使使旋转后公共因子的贡献更加分散,并对主因子进行命名,确定经济含义[10]。因子旋转主要有正交旋转
您可能关注的文档
- 外研版必修2Module3Music单元测试.doc
- 外研版英语九年级上Module9过关测试.doc
- 外研版英语选修七单词和词组汉译英练习.doc
- 外研版高中英语必须修读3短语.doc
- 外研社5年级英语上册教案 (2).doc
- 外研社八年级下册英语课文翻译.doc
- 外研社小学英语(三年级起)1-8册单词表.doc
- 外研社新标准小学英语.doc
- 外研社版初一英语教材使用心得.doc
- 外研社高中英语词汇与短语实用手册(必修1--5)修改2-写单词.doc
- 内蒙古呼和浩特市回民区2025-2026学年八年级上学期期末考试数学试题【含答案】.pdf
- 黑龙江省绥化市绥棱县绥棱林业局中学校2025-2026学年八年级上学期1月期末数学试题【含答案】.pdf
- 陕西省榆林市第一中学分校2025-2026学年上学期期末质量检测八年级数学试题【含答案】.pdf
- UnitOurfamilyLessonMysmallfamilyIE(课件)粤教沪外教版英语三年级上册.pptx
- 相似三角形判定定理的证明课件鲁教版(五四制)数学八年级下册.pptx
- 第5章 二次函数复习.pptx
- 角的分类说课(课件)四年级上册数学人教版.pptx
- UnitBesportybehealthyReadingAbeginner’sguidetoexercise课件高中英语译林版.pptx
- 配电网保护、各级开关配置及整定计算.pptx
- 主变保护知识全面解析.ppt
最近下载
- 2025年最新部编版五年级语文下册1-8单元教材分析(全册) .pdf VIP
- 山东省烟台龙口市(五四制)2024-2025学年六年级上学期期末考试历史试题.pdf VIP
- 青少年编程:NOIP CSP 初赛篇.pdf VIP
- 2024年河南豫能控股股份有限公司招聘笔试真题汇总.docx VIP
- 小学科学教育三年规划实施方案.docx VIP
- 视频会议摄像机安装指导书.docx VIP
- 波束匹配-5G网络自适应技术.doc VIP
- 2025年河南豫能控股股份有限公司招聘考试笔试试题(含答案).docx VIP
- 急性心肌梗死PBL教学指南:临床思维培养与典型案例实战解析.pptx VIP
- iso9000实战大全iso9001教材iso9000培训讲义iso9000简述.pptx VIP
原创力文档

文档评论(0)