- 1
- 0
- 约3.55千字
- 约 4页
- 2023-07-23 发布于广东
- 举报
基于并行分离增广拉格朗日乘子法的字符矫正
1 增广拉格朗日乘子法
光学文本特征的检测(orc)作为一个相对古老的研究领域,发展相对成熟。为了更好地适应未来对OCR智能化的要求, 整个系统的用户界面友好性、适应性、操作简便性、产品稳定性、识别速度和可靠性将是OCR下一步的发展方向。
目前, 已经有很多方法检测文本图像的倾斜角度来矫正变形图片
低秩矩阵恢复问题源自矩阵重建, 而矩阵重建则起源于压缩感知 (CS) 中的信号重构问题, 是近年图像稀疏表示的研究热点
因此, 在保证字符矫正准确率前提下研究改进算法, 提升矫正过程的运算执行效率是本文工作的主要内容。本文研究了一种并行分离的增广拉格朗日乘子法 (PSALM) , 将并行分离与ALM相结合, 通过一个凸组合步骤形成新的迭代, 在保证收敛性的同时提高算法的计算速度。在大数据时代到来之际, 面临数据爆炸式增长, 利用并行和分布式计算方法, 考虑基于并行分离方法的OCR字符矫正方案显得非常有意义。
2 更正字段模型的构建
低秩矩阵恢复问题
2.1 字符图像的变形
由于拍摄视角的不同, 真实场景下拍摄的字符图像会有较大程度的变形。在实际情况中, 首先将拍摄的彩色图像变换成灰度或二值图像
理论上, A应该是低秩或逼近低秩的。
2.2 非零元素稀疏模型
实际上, 由于字符图像上存在一些小的不规则的笔画, 矫正后图像的低秩结构很容易被破坏。又因为这些笔画只占一幅字符图像所有像素的一小部分, 因此可以把它们看成是稀疏错误 (非零元素可以是任意大) 。此模型在文献[18]的人脸识别中已成功使用。因此公式 (2) 可以变成
式中:l
其中, 参数γ0控制了矩阵低秩和稀疏错误的折中关系, 可把上述问题称为基于低秩恢复的字符矫正。
3 经过修正的psalm算法
只要图像的变形不是特别大, 使用迭代凸优化的方法就能求出字符矫正问题的实际解。非凸不连续函数rank是奇异值的l
3.1 矩阵秩和l的问题
优化问题 (4) 虽然直观, 但是不易处理, 其最主要的问题就是矩阵秩和l
由矩阵范数的知识可知, 矩阵的秩与它的非零奇异值的个数相同。因此, 可以用核范数代替矩阵秩, l
文献[21]从理论的角度考虑, 权重参数λ应该是
3.2 优化问题的求解
公式 (5) 的目标函数虽然是凸的, 但其约束条件Due0c9τ=A+E是非线性的 (τ∈G) , 是一个非线性优化问题。解决这个问题的方法是将其做线性化处理, 约束条件变为
式中, J是雅可比矩阵, 是变换参数的偏导数。由此, 优化问题 (6) 可以写成
公式 (7) 是凸优化问题, 并且通过迭代能够得到原始非凸问题的有效解。研究显示
3.3 psalm算法
表1中, 每步迭代的主要计算成本在于步骤2, 即解决线性凸优化问题 (7) 。传统的ALM算法是交替地求出A、E和Δτ3项, 但是由于其收敛性和计算速度的不足, 本文借助快速的一阶算法———PSALM算法
PSALM算法的基本思想是寻找增广拉格朗日函数的极小值点代替直接求解原始的约束规划问题。对于问题 (7) , 其增广拉格朗日函数为
式中:Y∈R
当{μ
符矫正应用中具有问题规模大且实时性要求强的特点。随着计算机多核运算能力增强, 并行方式是解决大规模凸优化问题的有效手段之一。经典ALM算法是一种求解可分结构的凸优化方法, 通过对参数偏导求解最优值。它在各种优化领域中取得了相当认可, 但借助ALM矫正低秩字符图像仍有不足, 计算速度慢是主要问题, 子问题需进行依次顺序交替优化, 而每步计算中基于部分奇异值分解方法的收缩算子计算耗时大。本文利用PSALM算法, 把目标函数分解为几个小规模的易求解的子问题
根据并行分离原则, 可将式 (9) 中第1步迭代写成
与传统的交替迭代ALM算法相比, PSALM算法可以并行方式将式 (9) 分解成3个PSALM子问题, 编程时能够同时求解分解后的这3个子问题, 然后进行凸组合, 最后收敛到问题 (7) 的最优解。在空间允许的情况下, 这样处理会节省计算和迭代时间, 特别是多核机器中能够减少原ALM算法1/2的运算时间。因此, PSALM算法在保持收敛到原问题解的情况下, 计算速度要比传统的ALM算法快。
虽然上述迭代的每一步都包含一个凸优化, 但都有一个简单的封闭形式的解, 通过一个简单的步骤就能够有效地求解。求解过程中需用到CS研究中常见的软阈值 (收缩) 算子和奇异值分收缩解法
其中:x∈R, ε0, 这个算子也可以延伸到向量和矩阵, x对应的就是它们的元素;USV
式中:svd (·) 代表奇异值分解算子;J
1) 已知:γ∈ (0, 2) , ε0, 任意选取初始迭代值为A
2) PSALM步骤为
4) 终止条件为
如果满足终止条件, 则
4 传统alm算
您可能关注的文档
最近下载
- 2020高考物理:计算题专项训练.pdf VIP
- 2025年湖南铁路科技职业技术学院单招职业技能测试题库一套.docx VIP
- 尾矿库安全技术知识--培训课件.ppt VIP
- 尾矿库安全培训精选课件.ppt VIP
- 四级高频词汇带音标版.pdf VIP
- 化妆品检验与安全性评价 第一第二章.pptx VIP
- 农村自建房包工不包料合同模板.docx VIP
- 【2025届】青海初中学业水平考试中考语文真题试题【原卷+解析】.pdf
- 尾矿库基础知识培训.pptx VIP
- Unit 5 School activities Wrap up & Let's explore 课件(共36张PPT) 外研版英语四年级下册.pptx
原创力文档

文档评论(0)