- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中 文 信 息 学 报
第 17 卷 第 5 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol 17 No5
文章编号 :1003 - 0077 (2003) 05 - 0055 - 05
复杂彩色文本图像中字符的提取①
陈又新 ,刘长松 ,丁晓青
(清华大学 电子工程系图像所 ,北京 100084)
摘要 :从复杂彩色文本图像中提取和识别字符已经成为一个既困难又有趣的问题 。本文给出了一个具有
(
创新性和实用性的区域生长算法用于彩色图像的分割 :彩色图像游程邻接算法 CRA G color runlen gt h adj a
cency grap h algorit hm) 。我们将该算法用于彩色文本图像 ,首先得到图像的彩色连通域 ,再对这些连通域的平
均颜色进行颜色聚类 ,可得到若干个聚类中心 ,然后根据不同的颜色中心将图像分为相应的彩色层面 ,最后通
过连通域分析判断所需的文字层 。该生长算法修改并扩展了传统的BA G 算法 ,并将其运用于彩色印刷体文
本图像中 ,充分利用了彩色图像的颜色和位置信息 。实验结果表明新的方法能很好的从彩色印刷图像中提取
多种常见的艺术字 ,并具有较高的提取速度 , 同时保留了文字和背景图像的原始色彩 ,便于将来的图像恢复 。
关键词 :人工智能 ;模式识别 ;字符提取 ; 图像分割 ;CRA G 算法 ; 区域生长 ;彩色文本图像
中图分类号 : TP39 1. 1 文献标识码 :A
Character Extraction in Complex Color Document Images
CHEN Youxin , L IU Changsong , D IN G Xiaoqing
( Image Processing Div . , Depart ment . of Elect ronic Engineering , Tsinghua Univer sit y , Beijing 100084 , China)
Abstract : Today t here are a lot of document s wit h text characters printed on colored and/ or complex backgrounds.
To recognize t hese characters , t hey must be extracted from t he images in advance . In t his p ap er , two novel tech
niques are proposed and constitute a robust character extraction algorit hm . First , we search color connected compo
( )
nent by applying a new regiongrowt h algorit hmcolor runlengt h adj acency grap h algorit hm CRA G , t hen divide
t he image to several layers by clustering t he central color of all t he component s. Finally t he character layers are se
lected by connected component s (CC) anal
文档评论(0)