用数学运算实现数据压缩算法在此.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用数学运算实现数据压缩算法在此,本人①提出一种新型的压缩算法,即利用数学运算实现数据的高压缩率。计算机内的所有数据无论是文本文件、图形文件,还是可执行文件,都可编辑为16进制数据文件。下面就是一个文件的部分16进制数据:D5 E2 CA C7 D2 BB B8 F6 CA DD EA 7F 92 2311 23 42 7F DE 9D C7 98 72 1D A2 6F 7F 8F对于这种数据文件,基于简单的数学知识,我们有以下事实:①组成这些文件的数据均可视为一个有限位的整数序列,这是显然的,因为任意一个文件无论多长,总是有限的,于是其对应的数据文件也是有限的;②每个整数序列均可视为某个无理序列的一个片断,这也是显然的,做如此分析,意义主要在于随后的数据处理更易于实现;③每个无理序列均可由某个函数在某点的函数值取得,这在理论上是行的通的,如10进位制数据141421356…可认为是由无理数 =1的若干位片段获得。由此提出数学运算压缩算法的具体思想:①构造具备理想长度的无理数片段数据库,被压缩文件与之对应,;②构造函数库,这个数据库由足够简单的、易于实现高精度数值计算的函数构成,并使无理数片段数据库中的每一数据均可由函数库中的某一函数的某一相对简单的数值的函数值取得,或若干函数值的代数和;③任何一个文件在计算机上记录为一个数字序列,例如,一张刻滿的CD或DVD光盘,如果将其做成一个光盘映射文件,这个文件用数字的方式保存在计算机的硬盘上,将会是一个数字的序列(因为计算机中最终保存的都是16进制数据)。如果这个文件的数据文件排序与无理数片段数据库中某个无理数片段的排序相同,则这个文件可由函数库中的某个函数的某一函数值计算获得。④对任何一个文件,找出与之对应的无理数片段,并随之得到产生此值的函数f (x) 。于是文件将以函数形式f (x),参数1,参数,也即文件被压缩为简单的函数形式f (x),参数1,参数2。打开压缩文件时,只需简单运算即可得到原文件的数据文件。此设想的现实意义:面对浩如瀚海的数据,只需要极小的存储就可以代表。在网络上需要下载东西时,也无需下载实际的数据,只要下载与其对应的数学表达式,当真正需要时,在本地运算就可以了。这样,占用网络带宽将极低,甚至不用下载。例如:一个几百兆或几千兆的镜像文件,如果用一个简单的数学表达式来代表,我们完全可以直接把这个数学表达式抄下来即可。4 数学运算数据压缩法需考虑的问题数学运算数据压缩法也有相当大的局限性和不足:①现有的数据都是采用数字方法进行保存,数字方法有其优点,但也有其严重的缺点。用数学方法实现数据的无损压缩,是用“模拟”的方法来保存“数字”,数字数据永远只能、最大近似的“模拟”模拟数据,却不能完全真实的再现模拟数据。举例来说:e1,这可以看做一个模拟数据,e1的结果是一个数字信号。e1的结果永远是模拟e1,却不能代替e1这个数据。②数学运算数据压缩法的数据库巨大且生成的代价较大。以长度为百位无理数片段为基本单元的数据库为例,即使按十进制算,数据库中也将有10100数据及相应的生成函数,这是一个天文数字。但这是值得的,因为这毕竟得到了百分之九十几的压缩率,而对解压无过高要求,只需通过简单运算即可。如果建立的数据库足够大,将可以达到千万分甚至更大的压缩率。另外,我们可以通过一些方法,使数据库中的函数尽可能的少。这一方面可以参看下面第5部分的内容。③虽然对任意的数据,我们都可以用一个相对简单的数学表达式来代替,但代价比较巨大,且不易实现。我们可以采用“分段”的方法实现,就是对于任意长度为p1的数字序列,按照p2的长度进行分段,p2序列的数据对应的简单的数学表达式已经事先存放在一个数据库中,如果p2序列的压缩率足够,整个数据就可以达到p2的压缩率。具体实现思路请见下文。5 数学运算数据压缩算法的实现步骤假设我们想达到千分之几的无损压缩率(压缩后的文件是原来的千分之几),那我们需要创建一个包括一个如下格式的数据库:表1:数据库与数学代表式对应表 数学表达式 数字序列 f(x1) 0000……(991个0)……0000 f(x2) 0000……(991个0)……0001 …… …… f(xn) ffff……(991个f)……ffff 其中f(xn)是一个有限位的数学表达式,如e3、 、1og3等。在生成数据库时,采用某个数学表达式,取其运算结果到1000位,并且此结果序列与上表中的数字序列进行查找,与某一行相对应,就用此数学表达式代替这一行。这样,一个任意长度的数据序列,将按照每1000位进行分段,并查找上表1,每1000位用一个数学表达式相对应。在分段后,如果最后一个分段不足1000位,记下此段的长度,然后不足部分补0,然后再查找表1。此时形成的压缩文件内容如下:

文档评论(0)

lingyun51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档