8_数据压缩要点
* 字典编码压缩 字典编码(dictionary encoding)。压缩后的信息是字典中单词的索引号。 字典编码的基本思想就是给每个词编号,而不是给每个字母(或汉字)编号。 例如,50000个ASCII字符的文字,每个字符8位,共40万bit 50000*8=40万bit 如果它们由平均6个字母长的单词组成,大约8333个单词 如果给每每个单词一个代号,需要14位, 共8333*14=50000/6*14=11.7万bit * 字典编码压缩 【课堂练习2-45】下面是一首外国诗歌,其中包含了许多重复的字母组合。 The Rain Pitter patter Pitter patter Listen to the rain Pitter patter Pitter patter On the window pane 将此诗歌按照图示方法压缩。 * 现在归纳一下字典编码压缩的思想 在文本中查找字母组合,如果这个字母组合曾经出现过(意味着可以被索引),它将被移除并用指针/索引(就像上面练习中画出的箭头和方格)代替。 在计算机上的实现? (a)标记重复串起点和长度 所画的指示箭头和需要参照的字符串用当前位置与参照字符串的距离和拷贝字符数来表示。 例如,Pitter patter压缩后的结果为Pitter pa(7,4)。其中,7表示从当前位置倒数7个字符(包括空格),4表示把从该处开始
您可能关注的文档
- 7纸的使用与保存课件.ppt
- 普通心理学笔记.doc
- 7显微镜的使用.pptx
- 7虚位移原理.ppt
- 8 血液循环系统疾病预防讲座.ppt
- 8 钢液的炉外精炼原理.ppt
- 8-1高考模拟提能训(磁场及其对电流的作用).doc
- 8-2-常见非线性特性及其对系统运动的影响.ppt
- 8 细胞信号转导.ppt
- 6第六章 汽车电器设备的保养与维护.ppt
- 2025年下半年小学教师资格考试简答题汇总.pdf
- 护理教学比赛资源整合.pptx
- 2022泰和安消防 JTGB-HM-TX3H01 JTGB-HM-TX3H02 TGB-HM-TX3H03 系列点型红外火焰探测器.docx
- 2025年驾驶证资格考试最新最全交通标志大全.pdf
- 护理教学理念:更新与发展.pptx
- 2025年新驾考科目一巧记速记口诀(全国通用).pdf
- 2025年一级建造师《项目管理》黄金预测考点【打印版】.pdf
- 证券公司高级管理人员资质测试章节练习-第一部分综合类第六章至七章:证券投资基金法、信托法.pdf
- 护理教学研究:方法与成果.pptx
- 麻纺车间设备更新准则.docx
最近下载
- 外研版小学英语单词表全一年级起点.docx VIP
- 2024《森马服饰存货管理问题及完善对策研究(数据图表论文)》9300字.docx VIP
- 2026年河南机电单招试题附答案.docx VIP
- DB53/T 1447.4-2025 公路工程施工安全风险分级管控和隐患排查治理双重预防体系建设指南 第4部分:隧道工程.pdf VIP
- (高清版)DB33∕T 1169-2019 建设工程施工现场远程视频监控系统应用技术规程.pdf VIP
- DB53/T 1447.3-2025 公路工程施工安全风险分级管控和隐患排查治理双重预防体系建设指南 第3部分:桥梁工程.pdf VIP
- 超星尔雅学习通《艺术导论》章节测试答案.docx VIP
- 大族激光打标机说明书(CN)5.3.docx
- 给排水国标图集-04S531-3:湿陷性黄土地区给水排水检漏井.pdf VIP
- 高频精选:水文中心面试题库及答案.doc VIP
原创力文档

文档评论(0)