- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析法新工科建设之路·人工智能系列教材机器学习(MATLAB 版)第九章
01主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理
主成分分析法的基本原理算法9.1(PCA 算法)
主成分分析法的基本原理PCA 算法仅需保留 W 与样本的均值向量即可通过简单的向量减法和矩阵-向量乘法将新样本投影至低维空间中。显然,低维空间与原始高维空间必有不同,因为对应于最小的 m-个特征值的特征向量被舍弃了,这是降维导致的结果。但舍弃这部分信息往往是必要的:一方面,舍弃这部分信息之后能使样本的采样密度增大,这正是降维的重要动机另一方面,当数据受到噪声影响时,最小的特征值所对应的特征向量往往与噪声有关,将它们舍弃能在一定程度上起到去噪的作用。
主成分分析法的基本原理
02核主成分分析法
核主成分分析法主成分分析法是一种线性降维方法,它假设从高维空间到低维空间的函数映射是线性的。然而,在现实的不少学习任务中,可能需要非线性映射才能找到恰当的低维嵌入。非线性降维的一种常用方法是基于核技巧对线性降维方法进行“核化”。下面我们来推导主成分分析法的核化过程,核化后的主成分分析法称为核主成分分析法,简记为 KPCA。
核主成分分析法
核主成分分析法
核主成分分析法将式(9.19)和式(9.20)代入式(9.18) 后化简可得:
03PCA算法的MATLAB实现
PCA算法的MATLAB实现MATLAB 实现了对 PCA 算法的封装,提供了一个实现 PCA 功能的函数 pca(·),其调用格式为:
PCA算法的MATLAB实现输入参数说明:(1)X为数据集,假设有 n 个样本,每个样本m 维,则X是一个nxm 的阵,即每一行是一个样本,每一列是样本的一个特征。(2)Name.Value 是成对出现的参数名称及其取值,通常有下列几种情形。①AIgorithm’(算法),该参数的取值有 3种(a)svd’,奇异值分解,这是默认设置;(b)eig’,特征分解;(c)“als’,交替最小二乘法。由于 PCA 涉及求散布矩阵的特征向量,在 MATLAB 中有3 种算法,默认使用奇异值分解法,但当nm 时特征分解的速度要比奇异值分解快。交替最小二乘法是为了处理数据集 X 中有少许缺失数据的情况但是当X为稀疏数据集(缺失数据过多)时不好用。
PCA算法的MATLAB实现②Centered’(是否中心化),该参数有两种取值:(a)on’(默认中心化)(b)ofF该参数的作用是选择是否对数据进行中心化,即数据的特征是否进行零均值化(即按列减去均值,如果选择了on’,则可用 score*coef”恢复中心化后的;若选择了of,则可用 score*coef’恢复原始的 X。③‘Economy’(经济模式),该参数有两种取值:(a)on’(默认)b)of。有时候输出的 coeff (mx m 矩阵)过大,而且是没有必要的(因为要降维),所以可以只输出 coeff(以及 score,latent)的前l列,l是低维空间的维数,这个参数值默认是on’。如果要看见完整的 PCA 结果,则可以设置为“off”。④NumComponents’(指定的成分数)这个参数有两种取值:(a)number of variables(默认),(b)scalar integer。输出指定的成分数是更为灵活的 Economy,但是经过试验发现指定成分数仅在小于时有效,大于时无效。默认是 number of variables (即m,特征个数)。
PCA算法的MATLAB实现输出参数说明:(1)coe 为主成分系数,就是散布矩阵(协方差矩阵)的特征量矩阵(也就是投影矩阵)。完整输出的情况下是一个 m x m 阵。每都是一个特征量,按对应的特征值的大小从大到小进行排列。(2) score 为nx m 阵,满足 score =X*coe。注意,如果使用 pca 时默认中心化(即不对Centered’设置oF),拿 X*coe 和 score 对比时,必须将X中心化后再乘以 coeft,然后再和 score 对比。同样,如果 pca 使用的是默认值,恢复的X = score *coeff’ (注意转置)是中心化后的数据。(3)latent 为主成分方差,也就是各特征向量对应的特征值,从大到小进行排列。(4) tsquared 为t2统计量。(5)explained 为每一个主成分所贡献的比例,可以更直观地选择所需要降维的维数。(6)mu为X 按列的均值,仅当Centered’
您可能关注的文档
- 机器学习(MATLAB版)ch01-绪论 教学课件.pptx
- 机器学习(MATLAB版)ch02-线性模型与逻辑斯谛回归 教学课件.pptx
- 机器学习(MATLAB版)ch03-决策树 教学课件.pptx
- 机器学习(MATLAB版)ch04-贝叶斯分类器 教学课件.pptx
- 机器学习(MATLAB版)ch05-k近邻算法 教学课件.pptx
- 机器学习(MATLAB版)ch06-支持向量机 教学课件.pptx
- 机器学习(MATLAB版)ch07-人工神经网络 教学课件.pptx
- 机器学习(MATLAB版)ch08-线性判别分析 教学课件.pptx
- 机器学习(MATLAB版)ch10-聚类 教学课件.pptx
- 机器学习(MATLAB版)ch11-EM算法与高斯混合聚类 教学课件.pptx
- 六年级下册 人教版 语文 第五单元 第16课《表里的生物》课件.pptx
- Unit2 School things(复习课件)英语三年级上册(外研版三起2024秋).pptx
- 北师大版数学六年级上册《比赛场次》课件.pptx
- Unit+2+第2课时+Section+1+Listening+and+Speaking(同步课件)2024-2025学年七年级英语下册同步精品课堂(沪教版2024).pptx
- Unit+2+课时4+Grammar(同步课件)-2024-2025学年七年级英语下册同步精美实用课件(译林版2024).pptx
- 人教版初中英语八年级下册Unit9SectionA1a2d课件.pptx
- 初中中学Module+9+Unit+3+Language+in+use课件2023-2024学年外研版英语七年级下册.pptx
- 人教版道德与法治一年级上册12《玩也有学问》课件.pptx
- 人教版初中英语七年级上册Starter Unit1 Hello! 第3课时SectionB(1a-2b)(课件).pptx
- 人教PEP英语三年级上册《Unit 4 Plants around us Part A 》课件.pptx
文档评论(0)