7个径赛项目上的女子纪录的主成分分析处理.docVIP

  • 143
  • 0
  • 约1.06万字
  • 约 11页
  • 2019-08-31 发布于广东
  • 举报

7个径赛项目上的女子纪录的主成分分析处理.doc

PAGE PAGE 11 7个径赛项目上的女子纪录的主成分分析处理 摘 要 本文通过主成分分析的相关方法,建立了评价55个国家和地区1984年前在7个径赛项目上的女子纪录的数学模型。 针对前两个问题,通过求解样本相关矩阵,再根据主成分分析的相关方法,利用MATLAB软件求得样本相关矩阵的特征值和相应正交单位化特征向量。 针对第三个问题,由第二个的求解结果进行相关的分析,确定两个主成分的具体意义。第一主成分反应了各国家和地区的运动员的优秀程度;第二主成分反映了各国家和地区在短跑和长跑项目上的相对实力。 针对第四个问题,由前两个问题的求解结果,然后基于第一样本主成分的得分对各国家和地区排序,得出的结果与从原始数据中得到的直观看法基本吻合。 最后本文针对两种不同方式得出结果的差异性进行了分析。 关键词 主成分分析;相关矩阵;贡献率;第一样本主成分 一、问题重述 在实际问题的研究中,往往会涉及众多有关的变量。但是变量太多不但会增加计算的复杂性,而且也给合理的分析问题和解释问题带来了困难,一般来说每个变量所提供的信息在一定程度上有所重叠,因而人们希望用为数较少的互不相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的,主成分分析便是在这种降维的思想下产生的处理高维数据的方法([1])。 现请分析下表有关世界上55个国家和地区1984年前在7个径赛项目上的女子纪录数据(见附录),解决如下问题: (1)求其样本相关矩阵及它的特征值和相应正交单位化特征向量。 (2)求前两个标准化样本主成分及其累计贡献率。 (3)解释(2)中的两个主成分的意义。 (4)基于第一样本主成分的得分对各国家和地区排序,这与你从原始数据中得到的直观看法是否基本吻合? 二、问题分析 分析问题可知,文中所给数据较多,首先要合理使用MATLAB软件对数据进行处理;要求解文中问题,主要基于主成分分析法的相关方法。 由文中数据可知,所给的七个变量有着不同的量纲,这会引起各变量取值的分散程度差异较大。若用协方差矩阵求主成分,则优先照顾了方差大的变量,会造成很不合理的结果,为了消除由于量纲的不同可能带来的影响,故采用变量标准化的方法,即用相关矩阵求解。 对于前两个问题,可直接使用MATLAB中的相关函数进行求解。求解结果可用表格表示。 对于第三个问题,需要利用第二个问题求解出的第一主成分和第二主成分的表达式进行具体分析。 对于第四个问题,要先求各国家和地区的第一样本主成分的得分,然后再根据得分的高低具体分析。 最后针对文中的求解过程与求解结果,讨论模型的不足之处与需要改进的方法。 三、模型假设 假设题中所给数据均准确有效。 四、符号表示 符号 含义 样本协方差矩阵 样本相关矩阵 主成分 特征值 标准化特征向量 第个主成分的贡献率 五、模型建立与求解 本文运用主成分分析法对高维数据进行了降维处理,其间通过求解样本的协方差矩阵与相关矩阵来分析主成分,期望通过较少的变量来反映样本数据的绝大部分信息,假设当主成分的累计贡献率达到%时,即视为满足了提取原数据中绝大部分信息的要求。模型建立与求解如下: 5.1 模型建立 设是元总体,从中取得样本数据: 第个观测数据记作 , () 称为样品,引进样本数据观测矩阵 它是矩阵,它的个列即是个样品它们组成来自元总体的样本。观测矩阵的个行变量分别是个变量 在次试验中所取得的值。样本协方差矩阵及相关矩阵分别为 其中 ,, 利用和求得的样本组成分有下述结论: 设是样本协方差矩阵,其特征值为,相应的正交单位化向量为,这里,则第个样本主成分为 其中为的的任一观测值。当依次代入的个观测值时,便得到第个样本主成分的个观测值,此即为第个主成分的得分。 为消除量纲的影响,我们可以对样本进行标准化,即令 则标准化数据的样本协方差矩阵即为原数据的样本相关矩阵。由出发所求得的样本主成分称为标准化祥本主成分。只要求出的特征值及相应的正交单位化特征向量,类似上述结果可求得标准化样本主成分.这时标准化样本的样本总方差为。 实际应用中,将样本代人各主成分中,可得到各样本主成分的观测值。 5.2 模型求解 本文通过求解样本相关矩阵,根据累计贡献率提取主成分,并对主成分的含义给出了合理解释,最后对各国家的综合成绩进行排名。 5.2.1 求解相关矩阵 由题中所给数据,利用matlab求解,可得: 协方差矩阵为 相关矩阵为 的特征值及其正交单位化特征向量见表1和表2: 表1 特征值及其贡献率 特征值 5.7927 0.6604 0.2994 0.1283 0.0539 0.0399 0.0254 贡献率/(%) 0.8275 0.0943 0

文档评论(0)

1亿VIP精品文档

相关文档