- 65
- 0
- 约5.68万字
- 约 53页
- 2020-12-19 发布于江苏
- 举报
自然场景下的文字检测算法研究
摘 要
生活中的文字包含着丰富的语义信息,所以自然场景下的文字检测有着广阔
的应用场景和重要的现实意义。但自然环境下的文字检测会受到诸如复杂背景、
光照、字体、倾斜变形等诸多因素的影响,检测效果还不是很理想。近年来随着
深度学习理论的发展,许多优秀的检测算法被提出用来解决这个难题,EAST 就
是其中最为优秀的算法之一。尽管如此,EAST 仍然存在感受野不够大、对样本
权重分配不合理等问题,准确性和速度都有进一步提高的空间。本文针对以上问
题展开深入研究,主要内容和成果包括:
(1)构建了一种新的训练样本生成策略。在生成样本时,将裁剪边界变由
原来的0.3 倍缩小为0.1 倍,扩展了文字区域,加入了更多文字区域的边缘信息,
据此重新调整样本的权重;改进了随机裁剪的策略,放松了筛选条件,提升了正
样本容错率。实验结果表明,在不改变EAST 网络结构的基础上,使用本文提出
的样本生成策略可以提高算法的检测性能,在文字检测公开数据集ICDAR 2015
上和经典EAST 算法相比召回率、精确率、综合性能有了一定的提升。
(2 )构建了一种基于改进EAST 的文本检测算法。在经典EAST 的网络基
础之上,加入ASPP (Atrous Spatial Pyramid Pooling )网络,将不同尺度的感受
野特征进行融合,加大感受野的同时降低了网络复杂度,提升训练速度;将经典
EAST 网络模型中的class balanced cross-entropy loss 替换为dice loss ,然后根据
文本区域面积调整样本权重,提升对小区域文字的关注度,改进样本权重不合理
的情况,同时加快算法收敛速度。实验结果表明,相比于经典EAST 检测算法,
本文构建的自然环境文字检测算法,在ICDAR 2015 数据集和ICDAR 2013 数据
集上,在保持15 fps 的同时检测性能获得了明显的提升。与近年来提出的几种经
典的深度学习检测算法(CTPN、SegLink,PixelLink 等)相比,本文算法也取得
了优异的综合性能。
关键词:文本定位,EAST ,ASPP 网络,损失函数
Ⅰ
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 研究背景和意义 1
1.2 研究难点与挑战2
1.3 国内外研究现状5
1.3.1 传统的文字检测方法5
1.3.2 近年来效果显著的文字检算法6
1.3.3 国内外研究成果7
1.4 论文主要内容与结构安排 10
1.4.1 本文主要研究内容 10
1.4.2 论文结构安排 10
第二章 自然场景本文检测基础12
2.1 卷积神经网络 12
2.1.1 卷积神经网络的基本结构 12
2.1.2 输入层与预处理 12
2.2.3 卷积神经网络的基本结构 13
2.1.4 池化层与数据提取 13
2.1.5 激励层与非线性 14
2.1.6 全连接层与分类 15
2.2 EAST 文本检测算法 16
2.2.1 EAST 网络模型 16
2.2.2 EAST 算法检测结果 19
2.3 本章小结20
第三章 基于改进样本生成策略的EAST 算法21
3.1 边界增强处理21
3.2 随机裁剪的改进22
3.3 数据增强处理24
3.4 实验配置与数据集24
3.4.1 实验环境24
3.4.2 数据集简介26
3.5 测评指标28
3.6 实验结果对比与分析29
3.7 本章总结30
第四
您可能关注的文档
最近下载
- 新生儿肠外营养管理专家共识(2025).pptx VIP
- 2023活动断层避让.docx VIP
- 中国肺移植术后诊疗指南(2025版).docx VIP
- 2025年校长竞聘考试试题及答案.doc VIP
- 【营销星球】2025“趣兜风”主题五一城市放风大会活动策划案.pdf VIP
- 2025年苏教版(2024)初中生物七年级下册(全册)教学设计及反思(附教材目录P158).docx
- 2026年春湘美版(新教材)初中美术八年级下册教学计划及进度表.docx
- 重庆市城市环境卫生作业成本测算指南.docx VIP
- 【26春三下语文全册每课一练课时练(含答案31页).pdf VIP
- 12《家乡的喜与忧》第二课时(教案)-2022-2023学年道德与法治四年级下册.docx VIP
原创力文档

文档评论(0)