- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
35№4B
计算机科学2VOSVol
基于版面特征的文档图像的文本定位方法+
钟挥黄洋
(沈阳建筑大学信息与控制工程学院 沈阳110168
脖胀F女r展Ⅱ城.接着a过豪类分析末提取x奉E,最月椎#十i字符日自身《$E域m“、宽高m等特扯有#《
位m目像十i奉Ⅱ域。对超t100自目iA告i#目像进行女驻,均&得较*意%i。宾验£现i&∞准自丰自
4壕挂“、切分聚#分析等”41啡&**}徂女。t皋E理日准女£住特有“十提高目i≈§≈#目像∞括索&
率.
关键目i#目谆,i$£t,i$握口,}符切》
类算法.其基奉原理是给定娄的个数K.将一个对象分到K
引言
十娄巾去,使得娄内对象之问的相似性最大,而类之间的相似
目像中的文本包古丰富的信自,如果这§E域能被自动 性最小。在粗略提取出文字边缘前提下,利用}均值聚类算
提取出来,则对图像的索引和检索是非常有价值的,图豫中文 法(K--3)把得到的所有特征向量分为三类,井得到=特征向
本提取包含M个步骤:(1)文本定位。即找出T同版面田像中量的聚类中心,此时各特征向量对应的原图像中像素点也被
包古文本∞《形日域。(2)文本识别。Ⅺ提取出的立车Ⅱ域 分为=类。背景非边缘部分变化此较缓慢.对拉普拉斯算子
进行相关图像Ⅱ处理,然后进行字符识别。空奉定位是文本 的相应鞍弱,对应着聚类中。离(0∞最*的一娄向量,相反.
识别的前提,是立本提取的关键。 立字边缘Ⅱ域和背景边缘部分对拉普拉斯算子的相应№较%
文本的特征主要包括颤色特征、字符太小、字符间距等特 烈,对应着聚类中。离(o∞最自的一类向量.而相应舟f两
征,采月自顶向T自底向t等方式,提取出文本对象和分离 者同的于图像B则对应着另一类向最。目此就粗略得到T=
文率层。随着多媒悻技术的发展,基f关键诃的图像检索技 十E域背景,文车B域、f图像在原文档目像中的位i,分别
术B经{能满足人们的要求,基}内客的圉像检索庙iⅢ±,对应着图1所iE域。可啦看到,自色的文本E域只是粗略
而目像中的文字是图像高层语义的重j来源。对fT同版面 标出了字符笔i的位置,笔i存在断裂m象。针对笔i断裂
特征的文特图像.文本定位准确与☆对信息索引、检索、数字 现象,这里采用形毒学膨胀运算来扩展文字边缘日域,得到相
国书馆等粳域都有着重要的髟响。 应的局部连通文本Ⅱ域,然后通过反色处理恢复成原有图像.
2基于版面特征的文档图像的文本定位方法
本文综台女档目像中中文字符的常用特征.提出T一种
针对图文挹台版面的文档图像的文本定位方法.该方挂首先
利用拉普拉斯算子粗略检测出文字边缘Ⅱ域.利用形态学膨
胀法扩展日域,接着通过聚共分析得到文车层,然后对月部连
通文本E域进行切分,提取出单十字符特征,最后利用字符亮
高比、占矩形日域的&例等特征.扩晨文本行Ⅸ域,从自宴现
文档图像的文本定位。通过对图像的文车定位,将有效提高
图文混台文档图像的柱索效率.
z1文档圄像预处a
顶处理阶段的目的是租略提取出整幅图像中文丰边缘B 2 3女本E域的切分方法
域。由f噪声点对边沿植测有定影响.因此拉普拉斯算于 通过对局部连a支奉E域的切分目的是为T提取字符本
是技果最好的边沿柱测器。首先,在256色文档图像转化为 身及相邻字符的一些位置特征。这i《用基f连遵域的切分
灰度图像的前提下,经过目十拉普拉斯模板算于的分别作用. 算法&行字符切分,主要采用灰麈值分级的概念,灰度值分级
可“樽到两幅新的“目像”,选样原圉像中每个像素点都有一 通常采用直方圈均衡法.这种分级不改变像紊衷度憧,只对每
个新得到“图像”中对应忙i的值构成的特征向量(V1.V2)。个像素设置个级别。根据藏度分级的结果把图像趾理为分
为了更好地提取出文率E域,需对文档
文档评论(0)