- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
西北工业大学 电子信息学院 L o g o L o g o 西北工业大学 电子信息学院 多媒体压缩编码方法综述 西北工业大学电子信息学院 * * 西北工业大学 电子信息学院 目录 压缩编码分类 1 音频信息压缩编码 2 图像压缩编码 3 * 西北工业大学 电子信息学院 * * 压缩编码综述 一. 压缩的需要 多媒体信号的数据量巨大,如: 一幅1024*1024真彩图有3MB 5分钟的CD音乐有50.47MB 90分钟的PAL视频数字化后有203.68GB 为了节省存储空间和传输带宽,进行实时高质的多媒体通信,必须对多媒体数据进行压缩编码 西北工业大学 电子信息学院 * * 压缩编码综述 二. 压缩的可能 多媒体数据和人类的感觉存在着各种冗余,如: 空间冗余:图像的相邻像素相关 时间冗余:相邻音频样本/视频帧相关 频率冗余:相邻的频谱值相关,人对高频信号不敏感或分辨率低 听觉冗余:人耳的低音听阈高、强纯音的频率屏蔽、相邻声音的时域屏蔽 视觉冗余:人眼对亮度变化比对色彩的变化更敏感、对高亮区的量化误差不敏感、视网膜分频道 西北工业大学 电子信息学院 * * 压缩编码综述 1. 有/无损 无损压缩(Lossless compression):原始数据可完全从压缩数据中恢复出来,即在压缩和解压缩过程中没有信息损失。压缩比2:1左右 Huffman、算术编码 、游程编码(上述三种成为熵编码)、ABO 、LZW 、ZIP 、RAR 有损压缩(Lossy compression) :原始数据不能完全从压缩数据中恢复出来,即恢复数据只是在某种失真度下的近似。压缩比2:1-1000:1 预测编码(差分脉冲预测编码DPCM);变换编码:KLT、DCT(运用最广)、ADCT、DWT基于;模型编码:分形、轮廓、识别合成编码;直接影射:矢量化、神经网络(具有自适应特性)、小波变换编码 2. 对称性: 若编解码算法的复杂性/所需时间差不多,则为对称的编码方法。多数压缩算法都是对称的。 不对称的一般是编码难而解码容易(如Huffman编码与分形编码)。但用于密码学的编码方法则相反,是编码容易,而解码则非常非常难 西北工业大学 电子信息学院 * 西北工业大学 电子信息学院 * * 压缩编码综述 3. 帧间/内 在视频编码中会同时用到帧内与帧间的编码方法 帧内编码是指在一帧图像内独立完成的编码方法,同静态图像的编码,如JPEG 而帧间编码则需要参照前后帧才能进行编解码,并在编码过程中考虑对帧之间的时间冗余的压缩,如MPEG 4. 实时性 在有些多媒体的应用场合,需要实时处理或传输数据,编解码一般要求延时≤50ms。这需要简单/快速/高效的算法和高速/复杂的处理芯片 5. 分级处理 有些压缩算法可以同时处理不同分辨率、不同传输速率、不同质量水平的多媒体数据,如JPEG2000、MPEG-2/4 西北工业大学 电子信息学院 * * 压缩编码综述 1. 熵编码:数据的统计信息进行压缩的无语义数据流的无损编码。如RLE、LZW、Huffman编码 2. 信源编码:信号原数据在时间域和频率域中的相关性和冗余进行压缩的有损义编码。除熵编码外的其他编码算法都在信源编码的范围内。 3. 混合编码:熵编码 + 源编码大多数压缩标准都采用混合编码的方法进行数据压缩,一般是先利用信源编码进行有损压缩,再利用熵编码做进一步的无损压缩。如H.261、H.263、JPEG、MPEG。 常见编码方法 西北工业大学 电子信息学院 * * 音频信息压缩编码 1. 音频信息压缩的可行性 ?语音信号中存在大量的冗余信息(相关性、周期性、概率分布的非均匀) ?人耳对低频成分比高频成分敏感,对相位特征的不明感。 ?人耳的“听觉掩蔽”效应:某一声音引起对其他声音的敏感度下降。 2. 音频编码技术的评价指标 ?编码速率(反应压缩程度) ?合成语音质量(人对声音的感知频率在20~20 000Hz) ?编解码的延时(公用电话网5~10ms,移动通信网100ms) ?算法复杂程度(直接决定算法的应用广泛程度) 3. 音频压缩编码的分类 ?波形编码(脉冲编码调制(PCM)、增量调制(DM)、差分脉冲预测编码DPCM、自适应差分脉冲编码调制(ADPCM)、子带编码(SBC)和矢量量化编码(VQ)等 ) ?参数编码(典型电表为线性预测(LPC)编码) ?混合编码(上述两种编码特点的结合) * 西北工业大学 电子信息学院 * 西北工业大学 电子信息学院 * * 音频信息压缩编码 一、音频信息压缩编码的分类 1. 波形编码 ?原理:重建的语音波形保持原有的波形状态。 ?优点:实现简单、语音质量较好、适应性强等。 ?缺点:话
文档评论(0)