统计学10主成分和因子分析.ppt

统计学 ─从数据到结论 第十章主成分分析和因子分析 汇报什么? 假定你是一个公司的财务经理,掌握了公司的所有数据,这包括众多的变量,如:固定资产、流动资金、借贷的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、分工和教育程度等等。 如果让你向上级或有关方面介绍公司状况,你能够把这些指标和数字都原封不动地摆出去吗? 需要高度概括 在如此多的变量之中,有很多是相关的。人们希望能够找出它们的少数“代表”来对它们进行描述。 需要把这种有很多变量的数据进行高度概括。 10.1 主成分分析 本章介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principal component analysis)和因子分析(factor analysis)。 实际上主成分分析可以说是因子分析的一个特例。在引进主成分分析之前,先看下面的例子。 成绩数据(student.txt) 100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。 从本例可能提出的问题 目前的问题是,能否把这个数据的6个变量用一两个综合变量来表示呢? 这一两个综合变量包含有多少原来的信息呢? 能否利用找到的综合变量来对学生排序或据此进行其他分析呢? 空间的点 例中数据点是六维的;即每个观测值是6维空间中的一个点。希望把6维空间用低维空间表示。 先假定只有二维,即只有两个变量,由横坐

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档