- 0
- 0
- 约8.25万字
- 约 69页
- 2026-03-09 发布于江西
- 举报
摘要
在当前医疗健康管理领域,对药品的准确快速识别需求日益增长,特别是在
药盒图文检测与识别技术上。随着深度学习技术的进步,这一技术已成为药房文
字识别的新解决方案。传统的光学字符识别(OpticalCharacterRecognition,OCR)
技术在处理复杂背景和多样化文本布局的药盒时面临挑战,如识别率低和处理速
度慢,这影响了药品信息的准确获取及药品管理的效率和安全性。
在深入分析现有文本检测与识别算法的基础上,针对药盒图文识别的特定需
求,如处理复杂背景、应对文字扭曲或遮挡,以及识别中英文混合文字,本文采
用了先进的深度学习算法,并引入了若干创新技术。这些技术显著提升了模型在
复杂场景下的文字识别准确性和实用性,有效地解决了传统方法在处理复杂背景、
文字扭曲或遮挡、低质量图像中的边界定位不准确,以及处理速度慢等局限,从
而显著增强了系统的性能和适用范围。具体如下:
(1)针对药盒文字识别提出了一种基于DBNet和CRNN的改进方法,通过引入
双三次插值上采样和反卷积技术,显著提高了模型在复杂背景和低质量图像中的
文字边界定位精度和细节恢复能力,从而提升了整体的文字识别准确率。创新有
效地解决了传统模型在处理扭曲或部分遮挡文字时的局限,增强了模型的实用性
和准确性。
(2)基于DBNet和CRNN模型的成功,研究推出了TRIM方法,用以优化复
杂文本识别。TRIM结合贝塞尔曲线和Transformer的自注意力机制,提高了对非
线性和变形文本的识别能力。此外,TRIM模型通过四种损失函数—分类、文本
识别、坐标和边界损失—全面优化,有效处理倾斜和弯曲文本,提升了复杂场景
下的识别效率和准确性。
(3)构建了一个专门针对药盒图文识别的数据集,包含中文和英文的清晰图片。
这一数据集极大地方便了研究人员和开发者进行算法测试和模型训练,有效推动
了药盒图文识别技术的进一步发展。
综上所述,通过融合DBNet和CRNN模型、引入Transformer模型,以及创
建针对性的药盒识别数据集,本研究在提高药盒图文识别的准确性和效率方面取
得了显著的进展。这些创新不仅对医疗健康领域的药物管理和患者安全有着积极
的意义,也为图文识别技术的发展提供了新的研究方向和应用场景,同时为药品
管理领域的技术发展和实践应用提供了有价值的参考。
关键词:深度边界网络,卷积递归神经网络,变压器模型,反卷积,场景文本识
别
Abstract
Inthecurrentmedicalandhealthmanagementsector,thereisanescalatingdemand
fortheaccurateandrapidrecognitionofpharmaceuticals,particularlyinthetechnology
ofdrugboxtextdetectionandrecognition.Withtheadvancementofdeeplearning
techniques,thistechnologyhasemergedasanewsolutionforpharmacytextrecognition.
TraditionalOpticalCharacterRecognition(OCR)techniquesstrugglewithcomplex
backgroundsanddiversetextlayoutsondrugpackaging,facingchallengessuchaslow
recognitionratesandslowprocessingspeeds,whichadverselyaffecttheaccurate
retrievalofdruginformationand,consequently,theefficiencyandsafetyofdrug
management.
Uponathoroughanalysisofexistingtextdetectionandr
原创力文档

文档评论(0)