- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
扫描文档图像兴趣域的自动检测及编码
朱庆生,王茜,傅鹤岗,舒润震
(重庆大学计算机学院.重庆400044)
E—mail:qszhu@cqu.edu.cn
摘薹:结合数字图书馆系统建设和应用的需求,文章提出一种基于文档分割的自适应文档图像兴趣域编码方法·
丈章针对数字化文档结构特征,详细描逑了一种基于块缩图和潦染技术的快速圜丈分割算法,谊算法分割图文时
不爱丈本倾斜和插图区域不规则的限制;在将插图域和文本域进行准确分割的基础上,文章提出了一种自适应生
成插图兴趣域屏蔽冒和兴趣域压缩蝙码算法,并给出采用该方法压缩舍有插图的扫描文档的示例.
关键词:潦染技术;图像分割;兴趣域编码;文档压匀k
/
1研究背景
在全球数字图书馆建设中,对腰书馆原来收藏的各种资料进行数字化处理已经势在必行。显然,简单采用光电阅读或
重新键盘输入方式来进行数字化转换,不仅工作量十分庞大,而且将丢弃原始资料中许多可视信息。为了保持这些资料的
原始性,目前多数书籍或资料都采用扫描方式输入计算机系统,然后用JPEG或GIF等格式存储。为了保持原始资料的可读
如改用300dpi扫描,可读性质量提高,但每页存储量上升为500KB左右。这种方法带来的问题一是需要的存储空间大,二
是网络传输速度慢,从而限制了数字化图书馆建设和应用的发展。因此.探索有效存储、检索、传输高质量彩色文档图像
的新方法是十分有意义的工作。
文档扫描图像与自然图像有很大的区别,因为它们包括一些有明显特征的不同区域,如文本区域、线图区域(框图、
流程图等)、连续色调区域(彩色图片、医学图片等插图)。一般来说,文本或线图要求具有高空问分辨率而不太关心色分
辨率,连续色调图像则要求高色分辨率而允许低空阃分辨率,这为我们研究新的压缩算法提供了很大的发展空间。
目前对文档图像压缩算法的研究可归类为块分割或层分割两类。基于块分割的方法…先将图像划分为不重叠的像素块-
并将每个块蛀为菜个确定的块类,然后根据不同块类的特征、采用不同算法进行压缩,解码时由各块拼接重构原图。基于
层分割的方法”州先将图像分割为不同的层面,如背景层、前景层等,然后每层独立编码,解码时由各层叠加重构原图。多
的表示方法.前景层含文本和线图的颜色信急,背景层含图片和背景信息,屏蔽码是一张标识每个像素点取前景色或背景
色的一:值围。实际上,块分割和层分割两种方法密切相关,有时它们可组合应用以取得更好的效果”1。
ofInte北st)是指扫描文档中需要
本文针对文档图像特征,引入兴趣域编码的概念。文档图像的兴趣域(ROI:Region
入插图兴趣概念后.有利于实现对插图区域的高质量编码,而且在恢复时允许用户对插图区域提出解压要求。当读者对文
档中的插图区域感兴趣时,系统可对这块区域采用高质量、低压缩比,而对其他区域采用低质量、高压缩比,从而取得读
基金项目:救育部优秀年轻教师基金(2000-1103)。
作者简介:朱庆生.1956年生,男.教授.先后在英国伦敷大学、美国伊利诺大学、香港浸会大学做访问研究员,发表论文50余篇,主要
研究方向为多媒体数据压缩技术、网络信息系统及软件开发环境等。王蔷,1964年生,女,剐教授,主要研究方向为电子商务安
全及网络通讯技术。傅■岗,1950年生,男.副教授,主要研究方向为软件工程和数据库应用系统。
364Session
8应ff]——————————————————————————————————一
本和插闺的轮廓信息.随后逐步传输插图的精度信息、不断细化插图的质量以满足用户需求。
在It盐普及I斫传输带宽有限的网络应用中,兴趣域编码和渐进传输技术有非常广泛的应用价值。例如,在下载含有高
精度图片的文档资料时,该技术町以使用户在看到插图轮廓后再决定是否继续下载它。兴趣域图像压缩技术能够在编码过
程中结合辟1rI}观判断,对圉像感兴趣区域进行交互式传输编码,只有当接收方需求时,系统才使兴趣区域的图像更清晰。
实现这一特僻对普及数字化图书馆的应用有着十分重要的意义。本文提出了一种基于对扫描文档分析和图文分割技术来确
矗t文档中的插图魁趣域的编码方法。
2
您可能关注的文档
- 去甲万古霉素治疗粒细胞缺乏患者发热的临床观察.pdf
- 去甲氧柔红霉素联合阿糖胞苷治疗非M3型急性髓系白血病疗效观察.pdf
- 去甲氧柔红霉素为主的联合化疗治疗急性白血病疗效分析.pdf
- 全脊旁银质针灸治疗慢性椎管外软组织损害型颈腰痛.pdf
- 全谱ICP-AES多谱拟合功能的验证及其在稀土产品纯度分析中的应用.pdf
- 全速解法在湍流跨音速流动的应用.pdf
- 犬附红细胞体病的治疗药物临床应用与分析.pdf
- 缺血性中风中西医结合诊治思路及用药.pdf
- 铜、血脑屏障指数、烯醇化酶检查对肝豆状核变性与意义及青霉胺导致神经症状加重与研究.pdf
- 铜对不同水稻品种种子萌发和生长与影响及在籽粒中积累与差异.pdf
最近下载
- 大学东南大学vlsi设计基础数字集成电路_2016vlsi1-课程介绍for mooc.pdf VIP
- 医美网络咨询与沟通(医美咨询师课件).pptx
- 2025中国华电集团有限公司校招+社招笔试参考题库附带答案详解.docx
- 【打印】人教版小学3-6年级英语词汇表.pdf VIP
- 液化气体钢瓶充装前后检查及充装记录.docx VIP
- 2025年高考数学新定义题型:集合下的新定义(四大题型)学生版+解析.pdf VIP
- 科室医疗质量自查工作制度.docx VIP
- 江苏省2017届九年级化学下学期第二次模拟试题.pdf VIP
- 广州市公务车维修项目工时费明细表.pdf VIP
- 内蒙古自治区点石联考2026届高三上学期9月份联合考试政治试卷(含答案).docx VIP
文档评论(0)