- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PCA降维方法(主成分分析降维)
一、简介?? ? ?? PCA(Principal Components Analysis)即主成分分析,是图像处理中经常用到的降维方法,大家知道,我们在处理有关数字图像处理方面的问题时,比如经常用的图像的查询问题,在一个几万或者几百万甚至更大的数据库中查询一幅相近的图像。这时,我们通常的方法是对图像库中的图片提取响应的特征,如颜色,纹理,sift,surf,vlad等等特征,然后将其保存,建立响应的数据索引,然后对要查询的图像提取相应的特征,与数据库中的图像特征对比,找出与之最近的图片。这里,如果我们为了提高查询的准确率,通常会提取一些较为复杂的特征,如sift,surf等,一幅图像有很多个这种特征点,每个特征点又有一个相应的描述该特征点的128维的向量,设想如果一幅图像有300个这种特征点,那么该幅图像就有300*vector(128维)个,如果我们数据库中有一百万张图片,这个存储量是相当大的,建立索引也很耗时,如果我们对每个向量进行PCA处理,将其降维为64维,是不是很节约存储空间啊?对于学习图像处理的人来说,都知道PCA是降维的,但是,很多人不知道具体的原理,为此,我写这篇文章,来详细阐述一下PCA及其具体计算过程:二、PCA原理1、原始数据:为了方便,我们假定数据是二维的,借助网络上的一组数据,如下:x=[2.5, 0.5, 2.2, 1.9, 3.1, 2.3, 2, 1,1.5, 1.1]Ty=[2.4, 0.7, 2.9, 2.2, 3.0, 2.7, 1.6, 1.1, 1.6, 0.9]T2、计算协方差矩阵什么是协方差矩阵?相信看这篇文章的人都学过数理统计,一些基本的常识都知道,但是,也许你很长时间不看了,都忘差不多了,为了方便大家更好的理解,这里先简单的回顾一下数理统计的相关知识,当然如果你知道协方差矩阵的求法你可以跳过这里。(1)协方差矩阵:首先我们给你一个含有n个样本的集合,依次给出数理统计中的一些相关概念:均值: ? ? ? ? ? ?标准差: ? ?方差: ? ??既然我们都有这么多描述数据之间关系的统计量,为什么我们还要用协方差呢?我们应该注意到,标准差和方差一般是用来描述一维数据的,但现实生活我们常常遇到含有多维数据的数据集,最简单的大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集,我们当然可以按照每一维独立的计算其方差,但是通常我们还想了解这几科成绩之间的关系,这时,我们就要用协方差,协方差就是一种用来度量两个随机变量关系的统计量,其定义为:? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??从协方差的定义上我们也可以看出一些显而易见的性质,如:?需要注意的是,协方差也只能处理二维问题,那维数多了自然就需要计算多个协方差,比如n维的数据集就需要计算CN2【此乃组合数基本公式】个协方差,那自然而然的我们会想到使用矩阵来组织这些数据。给出协方差矩阵的定义:? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?这个定义还是很容易理解的,我们可以举一个简单的三维的例子,假设数据集有三个维度{x,y,z},则协方差矩阵为? ? ? ? ? ? ? ? ? ? ? ? ??可见,协方差矩阵是一个对称的矩阵,而且对角线是各个维度上的方差。(2)协方差矩阵的求法:协方差矩阵计算的是不同维度之间的协方差,而不是不同样本之间的。下面我们将在matlab中用一个例子进行详细说明:首先,随机产生一个10*3维的整数矩阵作为样本集,10为样本的个数,3为样本的维数。[cpp]?view plaincopyMySample?=?fix(rand(10,3)*50)???根据公式,计算协方差需要计算均值,那是按行计算均值还是按列呢,我一开始就老是困扰这个问题。前面我们也特别强调了,协方差矩阵是计算不同维度间的协方差,要时刻牢记这一点。样本矩阵的每行是一个样本,每列为一个维度,所以我们要按列计算均值。为了描述方便,我们先将三个维度的数据分别赋值:[cpp]?view plaincopydim1?=?MySample(:,1);??dim2?=?MySample(:,2);??dim3?=?MySample(:,3);??%计算dim1与dim2,dim1与dim3,dim2与dim3的协方差:??sum(?(dim1-mean(dim1))?.*(dim2-mean(dim2))?)?/?(?size(MySample,1)-1?)?%得到??74.5333??sum(?(dim1-mean(dim1))?.*?(dim3-mean(dim3))?)?/?(?size(MySampl
您可能关注的文档
- 2016巴燕中心学校中考备考方案.doc
- 2016工作总结2017工作目标.doc
- 2016届高三生物尖子生非选择题专练.doc
- 2016年3月13日关于2015年中央和地方预算执行情况与2016年中央和地方预算草案的审查结果报告.doc
- 2016届安徽淮北一中高三最后一卷生物试卷(带解析).doc
- 2016年4月咨询工程师项目决策分析与评价考试模拟卷.docx
- 2016年4月绍兴市教学调测(一模)理科综合试卷-生物部分(word含答案).docx
- 2016年一级建造师工程项目管理重点梳理.docx
- 2016年IPO规则变化后分析文集.docx
- 2016届高三政治二轮复习作业二生活与消费2.doc
最近下载
- 高中英语写作专题18 读后续写全文模板·背诵50句(原卷版).docx VIP
- 18D009 数据中心工程设计与安装.pdf VIP
- 6.1树立法治观念课件(共33张PPT).pptx VIP
- 什么是课堂观察量表.docx VIP
- 2025公安招聘辅警考试笔试题及答案.docx VIP
- 深度解析《GBT 4340.1-2024金属材料 维氏硬度试验 第1部分 试验方法》.pptx
- 2024-2025学年第一学期 青岛版小学信息科技四年级上册 第一单元 信息科技基础 课时学历案 .pdf VIP
- 外研版(2025)必修第一册Unit 1 A New Start Developing ideas Writing 课件(13张ppt)(含音频+视频).pptx VIP
- 2024-2025学年第一学期 青岛版小学信息科技四年级上册 第二单元 反馈与优化 课时学历案 .docx VIP
- 高压试验危险点分析及控制措施.doc VIP
文档评论(0)