- 143
- 0
- 约1.06万字
- 约 11页
- 2019-08-31 发布于广东
- 举报
PAGE
PAGE 11
7个径赛项目上的女子纪录的主成分分析处理
摘 要 本文通过主成分分析的相关方法,建立了评价55个国家和地区1984年前在7个径赛项目上的女子纪录的数学模型。
针对前两个问题,通过求解样本相关矩阵,再根据主成分分析的相关方法,利用MATLAB软件求得样本相关矩阵的特征值和相应正交单位化特征向量。
针对第三个问题,由第二个的求解结果进行相关的分析,确定两个主成分的具体意义。第一主成分反应了各国家和地区的运动员的优秀程度;第二主成分反映了各国家和地区在短跑和长跑项目上的相对实力。
针对第四个问题,由前两个问题的求解结果,然后基于第一样本主成分的得分对各国家和地区排序,得出的结果与从原始数据中得到的直观看法基本吻合。
最后本文针对两种不同方式得出结果的差异性进行了分析。
关键词 主成分分析;相关矩阵;贡献率;第一样本主成分
一、问题重述
在实际问题的研究中,往往会涉及众多有关的变量。但是变量太多不但会增加计算的复杂性,而且也给合理的分析问题和解释问题带来了困难,一般来说每个变量所提供的信息在一定程度上有所重叠,因而人们希望用为数较少的互不相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的,主成分分析便是在这种降维的思想下产生的处理高维数据的方法([1])。
现请分析下表有关世界上55个国家和地区1984年前在7个径赛项目上的女子纪录数据(见附录),解决如下问题:
(1)求其样本相关矩阵及它的特征值和相应正交单位化特征向量。
(2)求前两个标准化样本主成分及其累计贡献率。
(3)解释(2)中的两个主成分的意义。
(4)基于第一样本主成分的得分对各国家和地区排序,这与你从原始数据中得到的直观看法是否基本吻合?
二、问题分析
分析问题可知,文中所给数据较多,首先要合理使用MATLAB软件对数据进行处理;要求解文中问题,主要基于主成分分析法的相关方法。
由文中数据可知,所给的七个变量有着不同的量纲,这会引起各变量取值的分散程度差异较大。若用协方差矩阵求主成分,则优先照顾了方差大的变量,会造成很不合理的结果,为了消除由于量纲的不同可能带来的影响,故采用变量标准化的方法,即用相关矩阵求解。
对于前两个问题,可直接使用MATLAB中的相关函数进行求解。求解结果可用表格表示。
对于第三个问题,需要利用第二个问题求解出的第一主成分和第二主成分的表达式进行具体分析。
对于第四个问题,要先求各国家和地区的第一样本主成分的得分,然后再根据得分的高低具体分析。
最后针对文中的求解过程与求解结果,讨论模型的不足之处与需要改进的方法。
三、模型假设
假设题中所给数据均准确有效。
四、符号表示
符号
含义
样本协方差矩阵
样本相关矩阵
主成分
特征值
标准化特征向量
第个主成分的贡献率
五、模型建立与求解
本文运用主成分分析法对高维数据进行了降维处理,其间通过求解样本的协方差矩阵与相关矩阵来分析主成分,期望通过较少的变量来反映样本数据的绝大部分信息,假设当主成分的累计贡献率达到%时,即视为满足了提取原数据中绝大部分信息的要求。模型建立与求解如下:
5.1 模型建立
设是元总体,从中取得样本数据:
第个观测数据记作
, ()
称为样品,引进样本数据观测矩阵
它是矩阵,它的个列即是个样品它们组成来自元总体的样本。观测矩阵的个行变量分别是个变量
在次试验中所取得的值。样本协方差矩阵及相关矩阵分别为
其中
,,
利用和求得的样本组成分有下述结论:
设是样本协方差矩阵,其特征值为,相应的正交单位化向量为,这里,则第个样本主成分为
其中为的的任一观测值。当依次代入的个观测值时,便得到第个样本主成分的个观测值,此即为第个主成分的得分。
为消除量纲的影响,我们可以对样本进行标准化,即令
则标准化数据的样本协方差矩阵即为原数据的样本相关矩阵。由出发所求得的样本主成分称为标准化祥本主成分。只要求出的特征值及相应的正交单位化特征向量,类似上述结果可求得标准化样本主成分.这时标准化样本的样本总方差为。
实际应用中,将样本代人各主成分中,可得到各样本主成分的观测值。
5.2 模型求解
本文通过求解样本相关矩阵,根据累计贡献率提取主成分,并对主成分的含义给出了合理解释,最后对各国家的综合成绩进行排名。
5.2.1 求解相关矩阵
由题中所给数据,利用matlab求解,可得:
协方差矩阵为
相关矩阵为
的特征值及其正交单位化特征向量见表1和表2:
表1 特征值及其贡献率
特征值
5.7927
0.6604
0.2994
0.1283
0.0539
0.0399
0.0254
贡献率/(%)
0.8275
0.0943
0
您可能关注的文档
- 减压蒸馏方法与装置.doc
- 电缆直径对照表.pdf
- 蒸馏水器操作规程.doc
- 中药热敷操作流程.doc
- 旋转蒸发仪的使用方法.doc
- 中药贴敷操作规程.doc
- 盐类的水解(蒸干问题)和常见离子.doc
- 旋转蒸发仪操作规范.doc
- 蒸馏与萃取导学案.doc
- 伤口敷料的应用.ppt
- 2025年山东省青岛开发区实验初三第三次诊断考试数学试题(文、理)试卷含解析.doc
- 半成品账务处理流程.doc
- 财务注销流程.doc
- 甘肃林业职业技术学院《口译入门》2023-2024学年第二学期期末试卷.doc
- 做账实操-豆粉加工厂账务处理流程 SOP 及会计分录实例.pptx
- 做账实操-豆类食品加工厂账务处理流程 SOP 及会计分录实例.pptx
- 湖南农业大学东方科技学院《医学导论2》2023-2024学年第二学期期末试卷.doc
- 做账实操-豆制品设备加工厂账务处理流程 SOP 及会计分录实例.pptx
- 2025年河南省新乡、开封市名校联考中考考前模拟物理试题含解析.doc
- 做账实操-废旧油脂脱水加工厂账务处理流程 SOP 及会计分录实例.pptx
最近下载
- (人教版2026新教材)数学二年级下册新教材解读课件.pptx
- 松下sj-mr220中文使用说明书.pdf VIP
- 融优学堂明式家具赏析(中国美术学院)章节测验答案.docx
- 2025年铁道统计公报 .pdf VIP
- 北汽新能源EU5维修手册OBC.pptx VIP
- ISO10292-1994建筑玻璃.多层玻璃稳态U值(热透过率)的计算.PDF VIP
- 北汽新能源EU5维修手册-电路图.pdf VIP
- TCNEA-核电工程班组建设评价指南及编制说明.pdf VIP
- 基层行低利率环境对金融增加值的影响分析.pdf VIP
- 2025-2026学年小学音乐鲁教版五四学制2024一年级下册-鲁教版(五四学制)(2024)教学设计合集.docx
原创力文档

文档评论(0)