- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析和因子分析
吴喜之
汇报什么?
·假定你是一个公司的财务经理,掌握了公司的所有数据,比如固定资产
流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、
产值、利润、折旧、职工人数、职工的分工和教育程度等等。
如果让你向上面介绍公司状况,你能够把这些指标和数字都原封不动地
摆出去吗?
当然不能。
你必须要把各个方面作出高度概括,用一两个指标简单明了地把情况说
清楚。
主成分分析
每个人都会遇到有很多变量的数据。
·比如全国或各个地区的带有许多经济和社会变量的数据;各个学校的
研究、教学等各种变量的数据等等。
这些数据的共同特点是变量很多,在如此多的变量之中,有很多是相
关的。人们希望能够找出它们的少数“代表”来对它们进行描述。
·本章就介绍两种把变量维数降低以便于描述、理解和分析的方法:主
成分分析( principal component analysis)和因子分析( factor
analysis)。实际上主成分分析可以说是因子分析的一个特例。在引
进主成分分析之前,先看下面的例子。
成绩数据( student sav)
·100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)
学生代码数学物理化学语文历英
61
2
70
84
8475
66
?1
86
83
从本例可能提出的问题
·目前的问题是,能不能把这个数据的6个变量用一两个综
合变量来表示呢?
这一两个综合变量包含有多少原来的信息呢
能不能利用找到的综合变量来对学生排序呢?这一类数据
所涉及的问题可以推广到对企业,对学校进行分析、排序、
判别和分类等问题
空间的点
例中的的数据点是六维的;也就是说,每个观测值是6维空间中的一个点。
我们希望把6维空间用低维空间表示。
先假定只有二维,即只有两个变量,它们由横坐标和纵坐标所代表;因此
每个观测值都有相应于这两个坐标轴的两个坐标值;如果这些数据形成一
个椭圆形状的点阵(这在变量的二维正态的假定下是可能的)
那么这个椭圆有一个长轴和一个短轴。在短轴方向上,数据变化很少;在
极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些
点的变化了;这样,由二维到一维的降维就自然完成了。
2
原创力文档


文档评论(0)