- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文档图像分割技术研究.pdf
文档图像分割技术研究8
付昱高芸黄祥林
中国传媒大学计算机与软件学院北京100024
摘要:在文档图像分析处理中,分割技术十分必要。本文介绍了目前文档图像分割算法中常用的
特征,并对针中文文档图像给出了一种分割方法。该方法首先利用Sobel算子粗略检测出文字边缘区
域,利用形态学膨胀方法扩展该区域,接着进行了两次颜色聚类分析,最后根据中文字符的特征进行
了一系列启发式处理,很好地分割出了文字区域。
关键词:文档图像分析图像分割文字提取
I引 言
随着信息技术的发展,许多传统纸张媒体实现了数字化以文档图像格式进行存储和传输。文档图像不
同于自然图像,一般包括文字、线图、图片等特定性质的区域块。图像中的文字则显得尤为重要,它相对
于其它语义内容更易于提取,有助于对图像内容的描述,可用于基于关键词的图像检索…。但文档图像是
以像素形式存贮的,很难直接操纵其中的文本内容,必须进行文档图像分析。而文档图像分害0则是其中的
关键技术,主要是如何从文档图像中提取文字区域。
在文档图像分割中,一般利用图像的区域、纹理等特征,提取出文字对象和分离出文本层。本文对此
进行了介绍和分析,并针对中文文档灰度图像给出了一种分割方法。该方法首先利用Sobel算子粗略检测出
文字边缘区域,利用形态学膨胀方法扩展该区域,接着进行了两次颜色聚类分析,最后根据中文字符的特
征进行了一系列启发式处理,很好地分割出了文字区域。
2文档图像分割的特征选择
在文档图像分割中,一般可以根据图像的区域特性、纹理结构和灰度值等特征进行处理,其中区域特
性又可以分为连通成分和边缘两种‘“。分割文档图像时,选择不同的特征对应着不同的处理方法。
2.1区域特性
基于区域特征的分割方法主要利用文本区域彩色或灰度值特性与相应背景特性之阉的不同实现的,其
又可以分为两种:基于连通成分的和基于边缘的。前者使用自底向上的方式,把小的成分逐步台并成较大
的成分,直到组合成能够鉴别的区域为止。这就需要几何分析,利用成分的位置信息来滤去非文字成分井
标记出文字的边界。例如Lee口1使用该方法检测和识别货物包装上的文字,并利用基于高宽比、行程度量等
特性来滤去非文字区域。该方法实现相对比较简单应用广泛,但当字符串是多颜色的和图像分辨率低时,其
可能将一个字符分成多个连通成分。后者主要处理文字与背景之间高对比度的图像。通常用边缘滤波器(拉
普拉斯算予、Canny算子等)找到文字的边缘,并用平滑操作或形态学方法将其组合起来,然后用启发式
+基金资助·受国家发改委项目(CNGI-04—12—2A)资助。
作者俺弁:付曼,男.硕士研究生,研究方向为信号处理技术和图像处理。
412 计算机技术与应用进展·2006
方法滤去非文字区域。Hasanp]用梯度算子检测边缘,利用膨胀算法组合离得较近的边形成候选文字区域,
最后利用文字大小、宽高比等特性滤去非文字成分。
2.2纹理特征
基于纹理的分割方法则利用了图像中文字结构特性与相应背景结构特性有明显区别的特点,使用基于
能量的变化,对能量变化进行闽值分析得N-值图像,然后对其进行连通成分分析(使用几何特性),最
后将文字区域合并起来得到结果。使用纹理信息来定位文本对字体大小很敏感,很难找到一个适合各种情
况的纹理滤波器集合。另外,基于纹理的过滤方法需要扫描整幅图像来检测和定位文字区域,计算比较复
杂,耗时比较多。
2.3灰度值特征
二值化技术基于灰度进行图像分层,一般包括全局、局部和自适应阈值方式,是最简单的文档图像分
割方法之一。因为文档图像有很多都是高对比度的,例如白色的背景和黑色的字体,所以能够通过设定阈
值分离出文本。Wu[5埽惘该技术把文档分成了文本层、背景层和颜色层:首先把ROB[]像转为灰度图像,
利用聚类分析把其转化为暗层、中间层和亮层,然后使用自适应二值化技术得到前景层和背景层,扩展前
景像素的区域为矩形块,最后从前景块中提取出文字来。
3文档图像分割算法实现
本文综合文档图像分割中常用的一些特征如边缘、灰度值等,给出了一种针对图文混合的中文文档灰
度图像的分割方法。该方法首先利用Sobel算
您可能关注的文档
- 文化误读与比较新闻学.pdf
- 文化资本化下的中国城市文化发展道路——循序渐进与平行推进道路选择的浅议.pdf
- 文化遗产价值评价标准EVA指标体系.pdf
- 文化遗产保护与利用的时代性在文化遗产保护与旅游发展国际研讨会上的讲话.pdf
- 文化遗产保护与旅游开发利用的和谐机制研究.pdf
- 文化遗产保护与旅游开发和谐共生机制研究.pdf
- 文化遗产保护和旅游发展共赢文化遗产保护与旅游发展国际研讨会综述.pdf
- 文化遗产保护引出的生态保护问题——以三峡大坝文化遗产保护研究为例.pdf
- 文化遗产地品牌的创立与管理研究.pdf
- 文化遗产地旅游资源价值评估体系研究.pdf
- 《GB/T 10810.3-2025眼镜镜片 第3部分:透射比试验方法》.pdf
- 中国国家标准 GB/T 45283.2-2025工业控制系统人机接口组态文件交互 第2部分:基础交互描述.pdf
- 《GB/T 45283.2-2025工业控制系统人机接口组态文件交互 第2部分:基础交互描述》.pdf
- GB/T 45283.2-2025工业控制系统人机接口组态文件交互 第2部分:基础交互描述.pdf
- 中国国家标准 GB/T 10810.3-2025眼镜镜片 第3部分:透射比试验方法.pdf
- GB/T 10810.3-2025眼镜镜片 第3部分:透射比试验方法.pdf
- 《GB/T 27995.1-2025半成品镜片毛坯 第1部分:单焦和多焦》.pdf
- GB/T 27995.1-2025半成品镜片毛坯 第1部分:单焦和多焦.pdf
- 中国国家标准 GB/T 27995.1-2025半成品镜片毛坯 第1部分:单焦和多焦.pdf
- 《GB/T 10810.5-2025眼镜镜片 第5部分:表面耐磨试验方法》.pdf
最近下载
- Unit 4 Eat Well(大单元说课稿)2024-2025学年七年级英语下册同步备课系列(人教版2024).docx VIP
- 《子路、曾皙、冉有、公西华侍坐》知识点.pptx VIP
- 《光电技术简明教程》全套PPT课件.pptx
- 《法国古典主义园林》课件.ppt VIP
- 资兴市鲤鱼江中学综合楼工程基于BIM的三维建模.docx
- 心理健康-六年级(下)-第18课-为升学做准备.pptx
- 全国计算机等级考试(二级)考试题库及参考答案(精练).docx
- 天翼云认证解决方案架构师考试题及答案(新版).doc VIP
- 广东广电运通招聘笔试题库2025.pdf
- 张丹海《简明大学物理》2-8功能原理机械能守恒定律.ppt VIP
文档评论(0)