- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析.ppt.ppt
主成分分析方法 主成分分析的目的与功能 在多变量分析中,分析者所面临的最大难题是解决众多变量之间的关系问题。进行数据降维可以用尽可能少的新指标取代原来较多的指标变量,并能包含原来指标变量所包含的大部分信息 。 解决多元回归分析中的多重共线性问题。 综合评价中,人们总是尽可能多地选取评价指标,而这些评价指标之间往往相互重叠,信息冗余是不可避免的。主成分分析则可以把这众多指标所蕴含的信息压缩到少数几个主成分指标,然后给出这几个主成分指标的权重,综合到一个评价指标中。 主成分的主要功能 数据降维(Dimension Reduction) 变量筛选(Variables Screening) 一、主成分分析的基本原理 二、计算步骤 (一)计算相关系数矩阵 rij(i,j=1,2,…,m)为原变量xi与xj的相关系数, rij=rji,其计算公式为: (三)确定主成分 (四)排序问题: 三、主成分分析实例1 下表是10名初中男学生的身高(cm),胸围(cm),体重(kg)的数据,试进行主成分分析。 Matlab程序 %cwfac.m function result=cwfac(vector); fprintf(相关系数矩阵:\n) std=corrcoef(vector) %计算相关系数矩阵 fprintf(特征向量(vec)及特征值(val):\n) [vec,val]=eig(std) %求特征值(val)及特征向量(vec) newval=diag(val) ; [y,i]=sort(newval) ; %对特征根进行排序,y为排序结果,i为索引 fprintf(特征根排序:\n) for z=1:length(y) newy(z)=y(length(y)+1-z); end fprintf(%g\n,newy) rate=y/sum(y); fprintf(\n贡献率:\n) newrate=newy/sum(newy) Matlab程序 sumrate=0; newi=[]; for k=length(y):-1:1 sumrate=sumrate+rate(k); newi(length(y)+1-k)=i(k); if sumrate0.85 break; end end %记下累积贡献率大85%的特征值的序号放入newi中 fprintf(主成分数:%g\n\n,length(newi)); fprintf(主成分载荷:\n) for p=1:length(newi) for q=1:length(y) result(q,p)=sqrt(newval(newi(p)))*vec(q,newi(p)); end end %计算载荷 disp(result) 利用Matlab求解 相关系数矩阵为 贡献率为 0.8069 0.1781 0.0150 * * 主成分分析的基本原理 主成分分析的计算步骤 主成分分析方法应用实例 主成分分析 ( Principal Components Analysis) 是由Hotelling于1933年首先提出的, 它是利用降维的思想,把多指标转化 为少数几个综合指标的多元统计分析 方法。 从数学角度来看,这是一种降维处理 技术。 一、数据处理 采集m维随机向量x=(x1,x2,…,xm)T的n个样品xi=(xi1,xi2,…,xim)T, i=1,2, …,n, nm,构造样本阵X x1T x11 x12 ┅ x1m x2T x21 x22 ┅ x2m X= ┇ = ┇ ┇ ┇ xnT xn1 xn2 ┅ xnm 1.对样本阵X中的元进行如下变换 x ij , 对正指标 Y ij = - x ij, 对逆指标 得 Y= Y ij n×p 2 对Y中元进行如下标准化变换 其中 得标准化矩阵Z: Z= z1T z11 z12
您可能关注的文档
- 中国银行利率风险与流动性管理项目(ILMS)-Pactera.PDF
- 中国颁布针对非上市公司实行股权激励计划的-DuaneMorrisLLP.PDF
- 中国风场运维市场规模将于2022年增至每年30亿美元.PDF
- 中国飞行员培养政策及未来发展应对PilotsCultivationPolicies-iaopa.PDF
- 中央电视台技术服务外包规范化管理CCTV李岩.pdf.PDF
- 中富通股份有限公司创业板首次公开发行股票申请文件反馈-中国证监会.doc
- 中山市2016年第十二月份建筑材料综合价.PDF
- 中德职业教育联盟.PDF
- 中文书名《品牌意识神经系统科学告诉我们真正的意识与品牌之谜》.doc
- 中文题目利用太赫兹时域光谱仪提取双层结构的材料参数关键词材料.PDF
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)