- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
秩极小化:理论、算法与应用*
林 宙 辰
北京大学机器感知与智能教育部重点实验室,北京100871
1. 引言
稀疏表示(Sparse Representation )[Elad2010]和压缩传感(Compressed Sensing )[EK2012]是目
前信号处理和机器学习领域的热门课题。所谓稀疏性,指的是有意义的信号在适当选取的一组过完
备基(Overcomplete Bases, 或称为字典, Dictionary )下可以只用其中少数几个基来表达。写成数学
表达式就是:
mn 1
如果 是一个合适的字典, 是有意义的信号, 是 在 下的最稀疏
W ( m n) y x0 y W
表示,即:
x0 arg min x 0 , s.t. y Wx,
x
x m x
则 ,其中 表示 中非零元的个数。
x
0 0 0
上面的描述是基于向量的稀疏性来刻画的。但在实际应用中,我们将面临着各种各样的数据,
如图像、视频和基因微阵列 (Microarray ),它们天然就是矩阵甚至是张量。于是我们就自然面对着
一个问题:如何度量矩阵和张量的稀疏性?如果套用向量的稀疏性,把它们强行展开成向量、按照
向量来处理,势必破坏数据内在的结构,在很多问题上就会行不通。比如图像或视频压缩,没有一
个人会把图像或视频当作向量来压缩,因为这样没有充分利用空间和时间上的相关性。再如Netflix
2
挑战 (图1),如果把用户/视频评价矩阵直接按向量处理,必然导致用户未评价的视频都是她/他不
喜欢的视频这样不合理的结论。
本文主要讨论矩阵的稀疏性。那么什么才是矩阵的稀疏性度量呢?回想上面的两个例子,大家
很容易都能想到要充分利用图像或矩阵的行及列之间的相关性。另外,作为流形学习[LV2007] 的基
本假定,我们知道真实数据都是存在于高维空间中非常低维的流形上的,而且往往都可以用低维的
子空间来近似,比如前几个主分量所张成的线性子空间。行列相关性和低维子空间都共同指向了线
性代数的一个基本概念:矩阵的秩。以上的例子都提示我们:秩是矩阵稀疏性的合理度量。事实上,
m n mn
秩是非常强的全局约束。一个 矩阵如果没有任何约束,它将有 个自由度;如果它的秩是 ,
r
则自由度将下降为r(m n r) 。因此,秩是很好的针对矩阵的正则化子(regularizer )。
* 本文得到国家自然科学基金资助。
1 对于压缩传感, 前面还会有一个压缩测量矩阵,这里不作赘述。
W
2 Netflix 是一家视频租赁公司,拥有很多用户对视频的评价,但这个用户/视频评价矩阵非常稀疏。该公司提供 100
万美元奖金希望能够把预测用户对视频的评价的准确率提高10%,以便有针对性地推荐,从而提高营收。见
/
1
图1 Netflix 挑战。需要预测用户对其未评价过的视频的喜好程度。
正如其他“新鲜”事物(如稀疏表示)一样,秩其实在统计学中早已被用作矩阵的正则化子,
如减秩回归(Reduced-Rank Regression )[Tso1981] ;在三维立体视觉里,秩约束更是随处可见
[MSKS2004] 。但是E. Candès 等人的工作赋予了秩极小化新的内涵,另外传统的已经获得巨大成功
的稀疏表
文档评论(0)