CN114708601B 一种基于深度学习的手写字擦除方法 (南京大学).docxVIP

  • 0
  • 0
  • 约1.32万字
  • 约 25页
  • 2026-01-11 发布于重庆
  • 举报

CN114708601B 一种基于深度学习的手写字擦除方法 (南京大学).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN114708601B(45)授权公告日2025.07.01

(21)申请号202210401782.4

(22)申请日2022.04.18

(65)同一申请的已公布的文献号申请公布号CN114708601A

(43)申请公布日2022.07.05

(73)专利权人南京大学

地址210008江苏省南京市鼓楼区汉口路

22号

专利权人江苏图客机器人有限公司

(72)发明人陈力军刘佳赖慧慧陈星宇

鄢伟

(74)专利代理机构江苏圣典律师事务所32237专利代理师胡建华

(51)Int.CI.

GO6V30/412(2022.01)

GO6N3/0464(2023.01)

GO6N3/08(2023.01)

GO6V10/774(2022.01)

GO6V10/82(2022.01)

(56)对比文件

CN113989816A,2022.01.28审查员朱佳利

权利要求书2页说明书8页附图3页

(54)发明名称

掩码生成模块

掩码生成模块

第一阶段图像生成模块第二阶段图像生成模块

(57)摘要

CN114708601B本发明公开了一种基于深度学习的手写字擦除方法。该方法针对文档图像进行手写字擦除,使用卷积神经网络模型,在保留印刷字与背景图像细节的同时,识别手写字区域并自动填补合适的像素值。其中,卷积神经网络模型引入跳跃连接,将网络浅层特征与深层语义信息结合,增强图像细节生成效果;采用可变形卷积方法,让网络自适应调节卷积采样位置,提高不同形状尺寸的手写字迹擦除效果;通过注意力机制,引导网络关注手写字区域的特征提取,提高分辨手写字与印刷内容的能力,减弱复杂背景对擦除效果的影响

CN114708601B

CN114708601B权利要求书1/2页

2

1.一种基于深度学习的手写字擦除方法,其特征在于,包括如下步骤:

步骤1,制作训练样本,包括含有手写字和印刷内容的原始图、手写字和印刷内容逐像素分类的掩码图以及只含有印刷内容的目标图;

步骤2,建立深度学习模型;

步骤3,将训练样本预处理后,送入深度学习模型进行训练,训练过程包括:输入训练样本中的原始图,输出掩码生成图和目标生成图;计算损失,优化模型参数;重复训练直至模型收敛,得到训练完成后的深度学习模型;

步骤4,获取需要去除手写字的文档图像;

步骤5,将需要去除手写字的文档图像输入训练完成后的深度学习模型,得到去除手写字后的图像,完成基于深度学习的手写字擦除;

其中,步骤3中,所述计算损失的方法包括:使用SmoothL1损失函数计算目标图损失,使用Dice损失函数计算掩码图损失,目标图损失和掩码图损失相加得到总损失loss,计算方法包括:

loss=Dice(imgmask,imgmask)+SmoothL1(imgtarget,imgtarget)

imgmask=M(imgorigin)

imgBtarget=G?(G?(imgorigin)

其中,imgorigin表示原始图,imgmask表示掩码图,imgtarge表示目标图,带顶线标注的变量表示对应的预测结果,imgmask表示掩码生成模块M生成的掩码图,im8target表示通过第一

阶段图像生成模块G?和第二阶段图像生成模块G?输出的目标图;

掩码图损失Dice(Y,Y)计算方法为:

目标图损失SmoothL1(Y,Y)计算方法包括:

其中,Y、Y分别表示同分辨率的两张图,每张图有n个像素值,y;和y分别表示Y和Y中的第i个像素值,smooth11函数用于度量两个值的距离,y和夏分别表示被度量的两个值,β取0.5。

2.根据权利要求1所述的一种基于深度学习的手写字擦除方法,其特征在于,步骤1中所述制作训练样本的方法包括:

步骤1-1,准备含有手写字和印刷内容的文档,使用拍照设备或扫描设备获取文档图像,得到原始图;

CN114708601B权利要求书2/2页

3

步骤1-2,采用图像编辑软件对原始图中的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档