- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文文本压缩的LZW算法.pdf
112 2014 ,50(3) Computer Engineering and Applications 计算机工程与应用
中文文本压缩的LZW 算法
1,2 1 1
陈庆辉 ,陈小松 ,韩德良
1 ,2 1 1
CHEN Qinghui ,CHEN Xiaosong ,HAN Deliang
1.中南大学 数学与统计学院,长沙 410083
2.中南大学 商学院,长沙 410083
1.School of Mathematics and Statistics, Central South University, Changsha 410083, China
2.School of Business, Central South University, Changsha 410083, China
CHEN Qinghui ,CHEN Xiaosong ,HAN Deliang. Compression algorithm LZW on Chinese text. Computer Engi-
neering and Applications, 2014, 50(3):112-116.
Abstract :This paper presents a compression algorithm for Chinese text which is improved from LZW algorithm. By modify-
ing LZW algorithm ’s dictionary size, basic set and the output way of dictionary code, the improved algorithm LZW_CH
demonstrates about 19% higher compression ratio than LZW19 ’s with almost the same execution speed. LZW_CH doesn ’t
need any pre-processing work for the compressing data. As a single compression algorithm, LZW_CH ’s compression
with long Chinese text has closed or exceeded the professional compression utility WinRAR.
Key words :Chinese text; data compression; compression algorithm; encoding; LZW
摘 要:结合中文文本中的汉字编码方式、大字符集以及重复字串不长三个不同于英文文本的结构特点对LZW 算法从
读取数据方式、基本码集和字典码值输出方式三方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19
提高了19%且压缩和解压速度与后者相当,其对较长的中文文本的平均压缩比已接近或者超过了压缩软件WinRAR 。
关键词:中文文本;数据压缩;压缩算法;编码;LZW
文献标志码:A 中图分类号:TP311 doi :10.3778/j.issn.1002-8331.1205-0383
1 引言 华强[10]等人针对汉字的编码以及大字符集的特点,从算
LZW 算法是1984 年Terry A.Welch[1]在字典压缩算 法读取数据的方式和修改算法的基本码集的方法对算
法LZ78[2]基础上改进的一种通用压缩算法。其较快的 法进行了改进。改进后的算法对中文文本的压缩比有
压缩速度和对各种数据文件的良好适应性使得其很快 一定的提高,但仍远低于LZW 算法对英文文本的压缩
成为LZ 系列压缩算法[1-6] 中最优秀的压缩算法之一。但 比。本文将提出一种新的中文文本压缩算法。这种算
文本数据,特别是以中文为主的文本数据,有着不同于 法是在现有的LZW 中文文本压缩算法的基础上进行改
其他类型数据的结构
您可能关注的文档
- 严重脓毒症患者胰岛素抵抗和胰岛素分泌与疾病严重程度及预后的相关性.pdf
- 严重脓毒症早期应用连续性血液净化的时机 及其器官保护作用:一项随机双盲对照研究.pdf
- 严重脓毒症早期血清乳酸、降钙素原、脑钠肽联合监测对患者预后的判断价值.pdf
- 严重脓毒症早期血清白蛋白水平对患者预后的评估价值.pdf
- 严重脓毒症液体复苏:人工胶体液有风险.pdf
- 严重脓毒血症与感染性休克患者中硫普罗宁治疗对肝脏的保护作用.pdf
- 严重腐蚀减薄后低碳钢管壁厚的远场涡流检测.pdf
- 严重腰椎不稳定型骨折行不同入路术式治疗的效果研究.pdf
- 严重腹主动脉畸形伴肾功能不全孤肾介入止血1例.pdf
- 严重腹外伤采用损伤控制手术治疗临床体会.pdf
文档评论(0)