扫描文档图像兴趣域的自动检测及编码.pdfVIP

扫描文档图像兴趣域的自动检测及编码.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
扫描文档图像兴趣域的自动检测及编码 朱庆生,王茜,傅鹤岗,舒润震 (重庆大学计算机学院.重庆400044) E—mail:qszhu@cqu.edu.cn 摘薹:结合数字图书馆系统建设和应用的需求,文章提出一种基于文档分割的自适应文档图像兴趣域编码方法· 丈章针对数字化文档结构特征,详细描逑了一种基于块缩图和潦染技术的快速圜丈分割算法,谊算法分割图文时 不爱丈本倾斜和插图区域不规则的限制;在将插图域和文本域进行准确分割的基础上,文章提出了一种自适应生 成插图兴趣域屏蔽冒和兴趣域压缩蝙码算法,并给出采用该方法压缩舍有插图的扫描文档的示例. 关键词:潦染技术;图像分割;兴趣域编码;文档压匀k / 1研究背景 在全球数字图书馆建设中,对腰书馆原来收藏的各种资料进行数字化处理已经势在必行。显然,简单采用光电阅读或 重新键盘输入方式来进行数字化转换,不仅工作量十分庞大,而且将丢弃原始资料中许多可视信息。为了保持这些资料的 原始性,目前多数书籍或资料都采用扫描方式输入计算机系统,然后用JPEG或GIF等格式存储。为了保持原始资料的可读 如改用300dpi扫描,可读性质量提高,但每页存储量上升为500KB左右。这种方法带来的问题一是需要的存储空间大,二 是网络传输速度慢,从而限制了数字化图书馆建设和应用的发展。因此.探索有效存储、检索、传输高质量彩色文档图像 的新方法是十分有意义的工作。 文档扫描图像与自然图像有很大的区别,因为它们包括一些有明显特征的不同区域,如文本区域、线图区域(框图、 流程图等)、连续色调区域(彩色图片、医学图片等插图)。一般来说,文本或线图要求具有高空问分辨率而不太关心色分 辨率,连续色调图像则要求高色分辨率而允许低空阃分辨率,这为我们研究新的压缩算法提供了很大的发展空间。 目前对文档图像压缩算法的研究可归类为块分割或层分割两类。基于块分割的方法…先将图像划分为不重叠的像素块- 并将每个块蛀为菜个确定的块类,然后根据不同块类的特征、采用不同算法进行压缩,解码时由各块拼接重构原图。基于 层分割的方法”州先将图像分割为不同的层面,如背景层、前景层等,然后每层独立编码,解码时由各层叠加重构原图。多 的表示方法.前景层含文本和线图的颜色信急,背景层含图片和背景信息,屏蔽码是一张标识每个像素点取前景色或背景 色的一:值围。实际上,块分割和层分割两种方法密切相关,有时它们可组合应用以取得更好的效果”1。 ofInte北st)是指扫描文档中需要 本文针对文档图像特征,引入兴趣域编码的概念。文档图像的兴趣域(ROI:Region 入插图兴趣概念后.有利于实现对插图区域的高质量编码,而且在恢复时允许用户对插图区域提出解压要求。当读者对文 档中的插图区域感兴趣时,系统可对这块区域采用高质量、低压缩比,而对其他区域采用低质量、高压缩比,从而取得读 基金项目:救育部优秀年轻教师基金(2000-1103)。 作者简介:朱庆生.1956年生,男.教授.先后在英国伦敷大学、美国伊利诺大学、香港浸会大学做访问研究员,发表论文50余篇,主要 研究方向为多媒体数据压缩技术、网络信息系统及软件开发环境等。王蔷,1964年生,女,剐教授,主要研究方向为电子商务安 全及网络通讯技术。傅■岗,1950年生,男.副教授,主要研究方向为软件工程和数据库应用系统。 364Session 8应ff]——————————————————————————————————一 本和插闺的轮廓信息.随后逐步传输插图的精度信息、不断细化插图的质量以满足用户需求。 在It盐普及I斫传输带宽有限的网络应用中,兴趣域编码和渐进传输技术有非常广泛的应用价值。例如,在下载含有高 精度图片的文档资料时,该技术町以使用户在看到插图轮廓后再决定是否继续下载它。兴趣域图像压缩技术能够在编码过 程中结合辟1rI}观判断,对圉像感兴趣区域进行交互式传输编码,只有当接收方需求时,系统才使兴趣区域的图像更清晰。 实现这一特僻对普及数字化图书馆的应用有着十分重要的意义。本文提出了一种基于对扫描文档分析和图文分割技术来确 矗t文档中的插图魁趣域的编码方法。 2

文档评论(0)

baihualong001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档