基于lrmr的背景建模方法研究.docxVIP

下载本文档

1
0
约3.69千字
约 5页
2023-07-22 发布于广东
举报
版权申诉

基于lrmr的背景建模方法研究.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于lrmr的背景建模方法研究 0 稀疏和低秩的传统表示方法随着计算机视觉和数据处理的广泛应用，目标识别导致了越来越多的计算机视觉和机械学习领域的科学家的研究，以及目标识别应用程序。近年来,压缩感知和低秩理论的研究使稀疏和低秩表示成为一种新的数据表示方式。基于凸优化的矩阵重建技术作为一种有效的数据分析手段在机器学习中扮演着重要的角色然而,随着现代视频数据捕获设备的发展,待分析的视频图像数据往往具有更高维更复杂的数据结构。传统的向量和矩阵等数据表示形式往往破坏了这些数据的原始空间结构,在分析过程中不能很好地刻画这些数据的本质和充分挖掘其内部特性 1 基于迭代阈值算法 LRMR将向量的稀疏表示推广到矩阵的低秩情形,它考虑如何从数据缺失严重的矩阵中恢复出本质上低秩的矩阵其中:目标函数为矩阵A的秩以及噪声矩阵E的l 其中:矩阵A的核范数定义为 σ 求解上述凸优化问题的几种常用的算法有迭代阈值算法(IT) 将视频序列的每一帧图像排列成一个列向量,则将所有图像序列对应的列向量排列成一个矩阵D,由于背景大体不变,所以背景可近似看做一个低秩矩阵;由于前景运动目标如车辆、行人等一般只占图像像素点的一小部分,所以前景可看做稀疏噪声 2 从交叉张的角度提取运动目标 2.1 vd的求解张量即多维数组,是1阶向量和2阶矩阵的高阶推广,其元素所在位置需要用三个或三个以上的变量来表示张量HOSVD是指将张量D分解成一个与其相同大小的核张量与多个矩阵的乘积形式。其中:张量S是一个与D大小相同的核张量,矩阵通常需要求核张量S,可通过式(6)求得其中:U 一般情况下,可以通过HOSVD分解找到一个张量珟D近似表示D,首先求得D的核张量S并对S进行阈值收缩,再通过反变换重建出珟D,可用数学符号表示为其中:矩阵 2.2 基于增广拉格朗日乘子法的运动目标提取 LRMR先将数据矩阵表示为低秩矩阵和稀疏噪声矩阵之和,再通过求解核范数优化问题来恢复低秩矩阵本文将输入的RGB图像序列均转换为灰度图序列,因此观测视频序列可用三阶张量D表示。由前文知,恢复低秩矩阵可由凸优化问题式(2)表示,则恢复张量表示的背景部分可将式(2)扩展到如下形式: 其中:D、A、E为相同大小的三阶张量,D∈R 引入辅助变量B,将上述优化问题式(7)转换为如下形式: 上述问题可通过增广拉格朗日乘子法(ALM)求得最优解。构造增广拉格朗日函数为其中:Y a)固定其他变量,更新B。通过对奇异值阈值方法 (a)张量分解其中:HOSVD(·)算子表示高阶奇异值分解。 (b)阈值处理 (c)张量重建 b)固定其他变量,更新A。通过最速下降法可求得式(11)的最优解: c)固定其他变量,更新E。可通过软阈值收缩算子S d)更新拉格朗日乘子Y 其中:ρ1,max 初始化: a)固定其他变量,更新B: b)固定其他变量,更新A: c)固定其他变量,更新E: d)固定其他变量,更新Y e)判断收敛条件: end while 输出A、E。本文运动目标提取算法的具体描述过程如下: a)将输入的f帧m×n的RGB图像序列转换成灰度图序列,并将该灰度图视频序列表示成三阶张量D∈R b)用张量高阶奇异值分解代替矩阵奇异值分解,用增广拉格朗日法重建出三维视频张量D的背景部分A和运动目标部分E。 c)针对获得的运动目标部分E,选取合适的阈值τ,对E按式(22)进行二值化处理,得运动目标F。 d)在背景不平稳的情况下,获得的运动目标部分中存在一定的动态背景带来的噪声干扰,影响提取运动目标的准确度。鉴于此,本文进一步对二值化处理后的稀疏部分F进行形态学中的开闭运算,消除运动目标区域外的噪声,达到最终提取较准确运动目标的效果。 2.3 算法的时间偏移分析本文算法中每次迭代都要分别更新B、A、E和Y 3 结果及其分析 3.1 运动目标效果为验证本文算法的有效性,本文从标准的change detection video database 视频1背景相对比较平稳,记录了多个行人和自行车车辆路过某草坪时的场景,尺寸为180×120。实验中选取有行人和自行车车辆路过的70帧进行测试。各算法在该场景下提取的运动目标对比效果如图3所示。从图3中可以看出,视频1背景比较平稳,背景差分和RPCA方法能够提取行人和自行车的主要部分,但目标区域中存在一些空洞,且两者提取结果中含有少量噪声;而本文方法提取的目标区域无空洞现象,且不含噪声,提取结果更加精确完整。视频2背景中有轻微树枝扰动,记录了大量车辆经过高速公路时的场景,尺寸为160×120。实验中选取含有车流经过的70帧进行测试。各算法在该场景下提取的运动目标效果如图4所示。从图4中可以看出,视频2背景有轻微树枝晃动,背景差分法提取运动目标中含有动态背景噪声点,RP