模式识别第讲.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第1页,共34页,星期日,2025年,2月5日第3次课程概要模式判别PCA特征评价维数比率问题第2页,共34页,星期日,2025年,2月5日PCAPrincipalcomponentanalysis主元分析或主成分分析功能:简化复杂数据到低维空间,从而发现数据中隐藏的简单结构。原始数据源(生数据)通常有冗余,包含噪声PCA的目标:去除冗余,并发现重要特征PCA特征评价维数比率问题第3页,共34页,星期日,2025年,2月5日PCA的大致思路认为原始数据X是复杂的(有噪声有冗余),要对X重新表示重新表示后数据的维度即为隐藏于X中的简单结构PCA特征评价维数比率问题第4页,共34页,星期日,2025年,2月5日PCA怎么做?技术路线利用线性代数为工具,用另一组基去重新描述数据空间新的基能够最好地表示原数据X原有的基是什么样的形式呢?Na?vebasis:目标:找到另一组基,能最好表达数据集,这个新的基是原有基的线性组合PCA特征评价维数比率问题采用该方法就隐含了一个假设:线性。数据限制在一个向量空间里,能被一组基表示第5页,共34页,星期日,2025年,2月5日基变换n个样本每个样本m个特征构成m×n的矩阵XP是从X到Y的转换矩阵几何上,Y由对X旋转拉伸得到P的行向量构成一组新的基,而Y是在这组基下对X的重新表示PCA特征评价维数比率问题第6页,共34页,星期日,2025年,2月5日在线性的假设条件下,要解答要寻求一组变换后的基,也就是P的行向量{p1,…pm}这组基就是X的主元要解答的问题1我们要将X转换成为的Y是个什么样子?2对应于Y,如何求解P?PCA特征评价维数比率问题第7页,共34页,星期日,2025年,2月5日我们要将X转换成为的Y是个什么样子?回顾一下PCA要解决的问题,数据复杂混乱

噪声冗余PCA特征评价维数比率问题第8页,共34页,星期日,2025年,2月5日重要特征和噪声的数学描述信噪比要使得信噪比大,信号的方差大,噪声的方差小假设:变化较大的信息认为是信号,变化较小的则是噪声PCA特征评价维数比率问题第9页,共34页,星期日,2025年,2月5日冗余的数学描述该变量可以用其它变量表示,因此造成了信息冗余PCA特征评价维数比率问题协方差矩阵可以反映数据的噪声和冗余的程度第10页,共34页,星期日,2025年,2月5日PCA的目标及它基于的假设PCA特征评价维数比率问题通过基变换,对协方差矩阵进行优化,即使得变换后的数据集Y,其协方差矩阵为对角阵。线性假设:PCA内部模型是线性的,是基于原始特征的线性变换。(如果原始数据存在非线性属性,则经PCA分析后将不再反映这种非线性属性)方差越大,特征越重要。(有些对整体方差贡献不大的主成分,有可能在样本分类方面起至关重要的作用)冗余用相关性表示。(数据的概率分布需要满足高斯分布或是指数型的概率分布)主元正交,即转换基是一组标准正交基。该假设的作用是方便求解第11页,共34页,星期日,2025年,2月5日PCA求解:特征根分解(1)PCA特征评价维数比率问题寻找一组正交基组成的矩阵P,有Y=PX,使得CY是对角阵,则P的行向量,就是数据X的主元向量。D是一个对角阵E是对称阵A的特征根排成的矩阵解题技巧,令P≡ET第12页,共34页,星期日,2025年,2月5日PCA求解:特征根分解(2)PCA特征评价维数比率问题第13页,共34页,星期日,2025年,2月5日PCA算法的一般求解步骤由以上推导,PCA算法的一般求解步骤如下1采集数据,形成m×n的矩阵,m为特征个数,n为样本数。2矩阵中的每个元素减去该维的均值,得到X3求XX‘的特征根PCA特征评价维数比率问题第14页,共34页,星期日,2025年,2月5日将PCA用于降维由PCA线性变换后得到的数据集,可认为是没有冗余的。在此结构下,可以讨论样本中的哪些属性(特征)比较重要。按方差由大到小排序,但丢弃的准则是什么?PCA特征评价维数比率问题方法一:Kaiser准则丢弃那些低于1的特征值方法二:观察特征值的图,通过斜率检测,即从图中曲线开始变平缓的点开始,丢弃后面的全部特征值。第15页,共34页,星期日,2025年,2月5日有关PCA需要注意的一个问题原始数据集里,每个特征是有意义的。比如图像中一个对象的形状、颜色等。但是线性变换后,语义信息丢失了。这对我们解释识别过程带来一定的问题。PCA特征评价维数比率问题

文档评论(0)

xiaozhuo2022 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档