- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学建模中主成分分析法
数学建模中主成分分析法
【摘要】本文通过介绍主成分分析法的基本知识,使学生在短时间内了解在数学建模中怎样利用主成分分析的思想、方法建立数学模型作一个初步的探讨。
【关键词】主成分分析;数据分析;累计贡献率
【Abstract】By introducing the basic knowledge of th principal component analysis method,so that students in a short period of time toto understand the use of thought, the method of principal component analysis to establish the mathematical model for a preliminary discussion of how in mathematical modeling.
【Key words】Principal components analysis;Data analysis;The cumulative contribution rate
全国大学生数学建模竞赛,已经成为许多高校学生课外科技活动的重要项目,人们也越来越关注数学建模竞赛。数学规划、微分方程、图论等是较为常见的建模方法。而近年来,越来越多的数据处理题目出现在数学建模竞赛当中,数据处理的任务是降低数据的维数,保留数据的有用信息。主成分分析法作为一种主要的数据处理方法,能够提取变量信息,减少分析的维度,使问题变得更简单、直观。因此,尽快掌握主成分分析法的基本知识,显得尤为迫切。下面介绍主成分分析法的基本知识,利用主成分分析法的思想方法建立数学模型。
1主成分分析的基本思想和数学模型
1.1主成分分析简介
主成分这个概念由美国统计学家Karl Pearson在1901年提出,当时只是进行了非随机变量的讨论。是从多指标分析出发,运用统计分析原理与方法提取少数几个彼此不想关的综合性指标而保持其原指标所提供的大量信息的一种统计方法。
1933年Hotelling则将此概念推广到了随机变量中。主成分分析的原理,是以较少数的综合变量取代原有的多维变量,使数据结构简化,把原指标综合成较少几个主成分,再以这几个主成分的贡献率为权数进行加权平均,构造出一个综合评价函数。作为一种多指标分析方法,在综合评价函数中,各主成分的权术为其贡献率,它反映了该主成分包含原数据的信息量占全部信息量的比重,这样确定权术是客观、合理的,它克服了某些评价方法中人为确定权术的缺陷,这种方法的计算比较规范,便于在计算机上实现。
1.2主成分分析基本思想
在许多实际问题中,为了全面系统的反应问题,我们通常用多个变量来刻画某一事物,但由于这些变量间具有较强的相关关系,变量间存在大量的重复信息,直接用它们分析问题时,往往会引起极大的误差。因此人们希望用较少的新指标代替原来较多的旧变量,同时要求这些新指标尽可能的反应原来的信息。
一般来说,主成分与原始变量之间的关系:
(1)各主成分都是原始变量的线性组合。
(2)主成分的个数远小于原始变量的个数。
(3)各主成分之间互不相关。
(4)主成分保留了原始变量的绝大部分信息。
1.3主成分分析的模型
假设有n个样本,有p个观测指标(p<n),得到原始数据矩阵X=(X1,X2,…,Xp),其相关系数矩阵为R。数学上通常的做法是将原来p个指标做线性组合,作为新的综合指标。记这些新的综合指标为Z1,Z2,…,Zk。最经典的方法就是用方差来表示。Z1,Z2,…,Zk这些新指标之间互不相关,且方差递减。
因此,计算相关系数矩阵的特征值为λ1≥λ2≥…≥λp,向量l1,l2,…,lp为相应的单位特征向量,则第i个主成分为
Zi=l■■X(i=1,2,…p)
一般是按累计贡献量的大小取前k个,多数情况下前几个主成分已代表了原来指标的大部分信息。
2主成分分析法的计算步骤
主成分分析法做多指标评价的基本步骤如下:
(1)对原来的p个指标进项标准化,Z■=■。
i=1,2,…,n,j=1,2,…,p;(其中,n为样本个数,p为原始指标的个数,x为原始指标样本值,s为样本标准差。)
(2)根据标准化后的数据矩阵求出相关系数矩阵R。
(3)求出相关系数矩阵R的特征根λ和特征向量l,以及贡献率
λi/■λi
(4)确定主成分F1,F2,…,Fk。
(5)计算综合评价值
F=(λ1 /■λi)F1+(λ2 /■λi)F2+…+(λk /■λi)Fk
3利用Spss进行
文档评论(0)