- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
zip 压缩原理和实现
zip 的压缩原理与实现
作者: HYPERLINK /member.php?action=showusername=webmaster \t _blank ???? 来源: HYPERLINK \t _blank zz???? 发表时间:2006-07-27???? 浏览次数: 3651 ???? 字号: HYPERLINK javascript:fontZoom(16) 大?? HYPERLINK javascript:fontZoom(14) 中?? HYPERLINK javascript:fontZoom(12) 小
无损数据压缩是一件奇妙的事情,想一想,一串任意的数据能够根据一定的规则转换成只有原来 1/2 - 1/5 长度的数据,并且能够按照相应的规则还原到原来的样子,听起来真是很酷。半年前,苦熬过初学 vc 时那段艰难的学习曲线的我,对 MFC、SDK 开始失望和不满,这些虽然不算易学,但和 DHTML 没有实质上的区别,都是调用微软提供的各种各样的函数,不需要你自己去创建一个窗口,多线程编程时,也不需要你自己去分配 CPU 时间。我也做过驱动,同样,有DDK(微软驱动开发包),当然,也有 DDK 的“参考手册”,连一个最简单的数据结构都不需要你自己做,一切都是函数、函数…… 微软的高级程序员编写了函数让我们这些搞应用的去调用,我不想在这里贬低搞应用的人,正是这些应用工程师连接起了科学和社会之间的桥梁,将来可以做销售,做管理,用自己逐渐积累起来的智慧和经验在社会上打拼。
????? 但是,在技术上来说,诚实地说,这并不高深,不是吗?第一流的公司如微软、Sybase、Oracle 等总是面向社会大众的,这样才能有巨大的市场。但是他们往往也是站在社会的最顶层的:操作系统、编译器、数据库都值得一代代的专家去不断研究。这些帝国般的企业之所以伟大,恐怕不是“有经验”、“能吃苦”这些中国特色的概念所能涵盖的,艰深的技术体系、现代的管理哲学、强大的市场能力都是缺一不可的吧。我们既然有志于技术,并且正在起步阶段,何必急不可耐地要转去做“管理”,做“青年才俊”,那些所谓的“成功人士”的根底能有几何,这样子浮躁,胸中的规模和格局能有多大?
??????在我发现vc只是一个用途广泛的编程工具,并不能代表“知识”、“技术”的时候,我有些失落,无所不能的不是我,而是 MFC、SDK、DDK,是微软的工程师,他们做的,正是我想做的,或者说,我也想成为那种层次的人,现在我知道了,他们是专家,但这不会是一个梦,有一天我会做到的,为什么不能说出我的想法呢。那时公司做的系统里有一个压缩模块,领导找了一个 zlib 库,不让我自己做压缩算法,站在公司的立场上,我很理解,真的很理解,自己做算法要多久啊。但那时自己心中隐藏的一份倔强驱使我去寻找压缩原理的资料,我完全没有意识到,我即将打开一扇大门,进入一个神奇的“数据结构”的世界。“计算机艺术”的第一线阳光,居然也照到了我这样一个平凡的人的身上。
????? 上面说到“计算机艺术”,或者进一步细化说“计算机编程艺术”,听起来很深奥,很高雅,但是在将要进入专业的压缩算法的研究时,我要请大家做的第一件事情是:忘掉自己的年龄、学历,忘掉自己的社会身份,忘掉编程语言,忘掉“面向对象”、“三层架构”等一切术语。把自己当作一个小孩,有一双求知的眼睛,对世界充满不倦的、单纯的好奇,唯一的前提是一个正常的具有人类理性思维能力的大脑。下面就让我们开始一段神奇的压缩算法之旅吧:1. 原理部分: 有两种形式的重复存在于计算机数据中,zip 就是对这两种重复进行了压缩。 一种是短语形式的重复,即三个字节以上的重复,对于这种重复,zip用两个数字:1.重复位置距当前压缩位置的距离;2.重复的长度,来表示这个重复,假设这两个数字各占一个字节,于是数据便得到了压缩,这很容易理解。 一个字节有 0 - 255 共 256 种可能的取值,三个字节有 256 * 256 * 256 共一千六百多万种可能的情况,更长的短语取值的可能情况以指数方式增长,出现重复的概率似乎极低,实则不然,各种类型的数据都有出现重复的倾向,一篇论文中,为数不多的术语倾向于重复出现;一篇小说,人名和地名会重复出现;一张上下渐变的背景图片,水平方向上的像素会重复出现;程序的源文件中,语法关键字会重复出现(我们写程序时,多少次前后copy、paste?),以几十 K 为单位的非压缩格式的数据中,倾向于大量出现短语式的重复。经过上面提到的方式进行压缩后,短语式重复的倾向被完全破坏,所以在压缩的结果上进行第二次短语式压缩一般是没有效果的。 第二种重复为单字节的重复,一个字节只有256种可能的取值,所以这种重复是必然的。其中,某些字节出现
您可能关注的文档
- ubuntu 10.04安装与配置.doc
- ubuntu11.04安装完后应该做20件事.doc
- ubuntu终端操作命令.doc
- UDDI安装与使用.doc
- UML系统分析和设计教程 冀振燕 第07章.ppt
- UNIX命令简介与其环境配置.doc
- Unix操作系统得入门和基础.ppt
- U盘安装系统 (!!!作者注:请下载【5月15号】发布那两篇,这个版本内容不全).ppt
- validation-jQueryvalidation表单验证插件.doc
- vbfdry毕业答辩PPT 制作与开场白模板.doc
- zh_ch_sh_r教学_2.ppt
- ZJH_Chap10_2nd_BGauss与环路定理_41p.ppt
- [PPT背景素材]五彩幻变花卉,免费,本身为动态母板,编成便捷准文本格式,和喜爱朋友分享。.ppt
- [PPT背景素材]童话般美景模片-1,免费,已合成为一套统一格式背景图片,和喜爱朋友分享。.ppt
- [PPT背景素材]孔雀PK动态演绎,免费,首末页为习作动态图片,准文本格式,自动播放便能体味。.ppt
- [PPT背景素材]世界名地绝美夜景,免费,总体为便捷准文本格式,配有乐曲,和喜爱朋友分享。.ppt
- [PPT背景素材]美景图照动态观赏,免费,总体为便捷准文本格式,配有乐曲,和喜爱朋友分享。.ppt
- [VB程序设计][][第7-9章].ppt
- [卢浮宫雕像]逼真翻书页准文本,免费,以一套极为典雅卢浮宫珍藏雕像为背景,编成便捷准文本格式供分享。.ppt
- [岳麓1][单元总结提升]第一单元 中国古代思想和科技.ppt
最近下载
- 黑龙江省中药炮制规范及标准 2012年版.pdf VIP
- 2025消防安全知识培训考试试题附答案.docx VIP
- 免维护铅酸蓄电池安装施工方案.pdf VIP
- 2024年新北师大版7年级上册数学课件 第5章 3 第1课时 以几何图形为背景.pptx VIP
- GB50341-2014 立式圆筒形钢制焊接油罐设计规范.docx
- 2.1确定主题 精搜索(课件)-七年级信息科技上册(川教版2024).pptx VIP
- 项目档案管理措施和方法.docx VIP
- 2024年南京社区工作者考试真题及答案.docx
- 导游证考试少数民族知识点整理.pdf VIP
- 2.2在线协作 选素材(课件)-七年级信息科技上册(川教版2024).pptx VIP
原创力文档


文档评论(0)