- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字化加工中各种压缩格式比较研究
数字化加工中各种压缩格式比较研究
摘 要:根据作者多年数字化加工的经验,从压缩格式的算法、存储、质量、成本及数字化加工标准等方面进行调查比较,给出常用的几种数字化加工系统所采用的压缩算法的建议。
关键词:文档数字化加工:图像压缩算法:图像存储格式:成本
中图分类号:TP399
一切由文字、图表、声像等形式组成的材料都可以叫做文件,已经办理完毕的、具有保存价值的文件按照一定的逻辑规律整理形成的信息单元就称之为档案。档案在不同时期有着不同的载体,上到石器时代的石刻,下到工业社会的照片、影片、唱片、录音带、录像,直到20世纪中期以后出现的磁带、磁盘、光盘等载体、依赖计算机系统存取并可以在网络上传输的电子文件,都是具有保存价值的档案[1]。电子档案的产生、是档案领域一次翻天覆地的革命,直接带来了档案工作的运作方式、基本理论甚至是思维等方面的巨大改变。
目前,社会各阶层、各部门都着手于信息化的工作,曾经堆积如山的档案文档成为必须进行处理的对象,作者在工作过程中,针对各种客户群的需求及客观现实问题的不同,对图像需要采取的压缩算法进行了一些比较与研究,主要讨论几个具有代表性的目标群体为:图书馆、医院、保险公司。
1 数字化加工常用的图像压缩算法
1.1 黑白二值图像的压缩算法
黑白文稿的压缩较常用的几种压缩技术是:JBIG、JBIG2、MH、MMR、MR。
(1)MH编码:是Group 3 Fax之中最基本的编码方式,是一种一维编码方案;(2)MR编码:也是Group 3 2D编码方式,与MH的区别在于,同时在水平和垂直方向进行压缩,属于二维压缩技术,压缩效率比MH提高35%左右;(3)MMR编码:Group 4编码,在压缩效率上跟MR是一样的;(4)JBIG编码:JBIG2可以方便的嵌入到TIFF文件中,压缩性能一般比G4压缩少3-5倍,比JBIG1少2-4倍[2]。但是JBIG有些算法涉及到版权问题,在应用中会产生费用问题,支持的扫描仪也不多,加工单位会因为经济需要在JBIG2与G4之间做取舍。
1.2 灰度图像和彩色图像的压缩算法
对于灰度图像和彩色图像的压缩,目前较常用的几种压缩技术是:JPEG、LZW、BMP。
(1)JPEG:JPEG可以压缩任何连续色调的静止图片,兼容性也很强,可用于大部分通用的计算机平台,硬件要求不高,得到近乎完美的图像质量[2]。JPEG是一种有损压缩方式,若压缩比选择过大图像质量会大幅下降;(2)JPEG2000:是一种新的图像标准,可以向下兼容JPEG,JPEG2000可以同时支持有损和无损压缩,具有很高的压缩率,比JPEG高约30%左右;(3)BMP:是Windows操作系统中标准图像文件格式,兼容性很强,但是对图像几乎不进行压缩,导致文件占用磁盘空间过大,不建议采用这种压缩格式;(4)LZW:LZW对于任意宽度和像素位长度的图像,都具有稳定的压缩过程,压缩和解压缩速度较快,对硬件的要求也不高。
2 文档数字化加工中数据的存储特点
2.1 文档数字化加工的流程
数字化加工流程如图1:
图1
2.2 图像压缩在数字化加工中的作用
所谓图像压缩,即采用特殊的编码方式保存图像数据,减少存储空间的占用,节约存储成本,提高信息传播速度。在文档的数字化过程中,产生的数据主要是图像数据和识别产生的文本数据,文本数据对存储空间的占用并不大,主要是图像数据的存储需要合适的压缩技术。该压缩技术即要满足图像的还原率、压缩率,还要对硬件、压缩解压的速度、格式的通用度,用户的需求等方面进行综合考量。
2.3 数字文档的存储格式
能满足双层存储的电子文档格式,首推双层PDF格式。PDF经中国国家国家标准化管理委员会批准成为正式的中国国家标准,已成为数字化信息事实上的一个工业标准。采取PDF作为电子文档的存储格式,避免了标准不统一造成的互操作性差,共享共建困难。
PDF是一种可移植性的文档格式,他能摆脱操作系统平台的限制,所以通用性更高,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一性能使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。
双层PDF格式文件包含文本层和图像层,并且位置上下对应。经扫描仪扫描录入的图像经过去污、纠偏等处理作为图像层;图像进行OCR识别,经人工校对之后,作为文本层,合成双层PDF文件。这样,既可以100%保留原始版面效果(包括公章、签名),又可以通过下层的文字信息支持选择、复制、全文检索等功能。因此,双层P
您可能关注的文档
最近下载
- 机械制图-形位公差培训讲义.pptx VIP
- 11.21 峥嵘岁月 课件-2024-2025学年高中音乐人音版(2019) 必修 音乐鉴赏.pptx VIP
- 08D800-7 民用建筑电气设计与施工-室外布线.docx VIP
- 16MR204城市道路-透水人行道铺设图集.docx VIP
- 肿瘤的诊断课件.ppt VIP
- DB1309T122-2022《海水池塘对虾养殖技术规范》.docx VIP
- 110kV变电站防雷接地施工方案.doc VIP
- 《电路分析基础》习题解析汇总(卢飒第二版) 第1--11章.docx VIP
- —机械制图与形位公差 识图与公差.ppt VIP
- 十足股份鲜食认证测试卷.doc
文档评论(0)