抗倾斜的中文文本图像文件识别技术①.PDFVIP

  • 10
  • 0
  • 约 6页
  • 2018-12-28 发布于北京
  • 举报

抗倾斜的中文文本图像文件识别技术①.PDF

抗倾斜的中文文本图像文件识别技术①.PDF

计算机系统应用 ISSN 1003-3254, CODEN CSAOBN E-mail: csa@ Computer Systems  Applications,2019,28(1):32−37 [doi: 10.15888/ki.csa.006751] ©中国科学院软件研究所版权所有. Tel: +86-10     抗倾斜的中文文本图像文件识别技术① 周一枫,  张华熊 (浙江理工大学 信息学院, 杭州 310018) 通讯作者: 张华熊, E-mail: zhxhz@ 摘 要: 针对实际应用场景中如何在大批量图像文件中快速找到中文印刷体文本图像文件进行OCR (Optical Character Recognition) 识别的问题, 本文在笔画宽度变换算法(SWT) 的基础上, 设计了针对中文文本固有特点的启 发式规则, 并将水平投影技术与离散傅里叶变换相结合, 提出了一种适合倾斜角度在–90至90°之间的中文印刷体 文本图像文件识别技术. 实验结果显示, 在 1606张测试集图像文件的识别中, 本文算法针对文本图像文件整体识 别F 值(F-Measure)为0.95, 平均识别耗时为0.65 s. 关键词: 笔画宽度算法; 中文文本图像文件识别; 水平投影; 离散傅里叶变换 引用格式:  周一枫,张华熊.抗倾斜的中文文本图像文件识别技术.计算机系统应用,2019,28(1):32–37. /1003-3254/6751.html Anti-Tilt Chinese Text Image File Recognition Technology ZHOU Yi-Feng, ZHANG Hua-Xiong (School of Information Science and Technology, Zhejiang Sci-Tech University, Hangzhou 310018, China) Abstract : In view of how to quickly find Chinese printed text image files in bulk image file for Optical Character Recognition (OCR) recognition in practical application scenarios, this study designs heuristic rules for the inherent characteristics of Chinese text, based on the Stroke Width Transform algorithm (SWT), and combines horizontal projection technology with discrete Fourier transform, a Chinese printed text image file recognition technique suitable for tilt angles between –90 and 90° is proposed. The experimental results show that in 1606 test set image files, the overall recognition F-measure of the algorithm for text image files is 0.95, and the average recognition time is 0.65 s. Key words: Stroke Width Transform (SWT); Chinese text image file recognition; horizontal projection; discrete Fourier transform   现阶段在纸质资料数字化的大背景下, 传统的纸

文档评论(0)

1亿VIP精品文档

相关文档