多媒体信息的编码技术.pptVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体信息的编码技术

多媒体通信中的编译码技术 多媒体 文本 音频 视频 图形 动画 图像 巨大的多媒体数据量 决定了 数据压缩成为多媒体发展的关键技术 根据 信号质量有无损失 有损编码 无损编码 模型编码、矢量量化、子带编码 变换编码、小波编码 霍夫曼编码、费诺-香农编码、算术编码、流程编码、Lempel-Zev 编码 与多媒体通信有关的压缩编码的国际标准主要有 JPEG H.261 H.263 MPEG G系列 静态图像 动态图像 音频 视频 多媒体的压缩技术 无损压缩 无损压缩又称冗余压缩,主要用于文本数据压缩。 算法的基本原理:去除或减小数据中的冗余,压缩过程中不能破坏数据中包含的信息,解码后的数据必须和原来的一样 有损压缩 有损压缩又称熵压缩,适用于图像和声音的压缩。 有损编码在压缩过程中减少了数据中包含的数据量,产生了一定的失真,因而译码后的数据与原来不一样。正是由于减少了数据量,有失真的压缩才能获得较高的压缩比 视频数据压缩技术 空间冗余,时间冗余 是主要的数据冗余。 他们是将图像信号看做随机信号时所反映出的统计特性,因此也称统计冗余。 根据信息论的原理,可以找到最佳多媒体数据压缩编码方法,数据压缩的理论极限是信息熵。 信息熵编码和变换编码是多媒体通信中两种主要信源编码方法 霍夫曼编码广泛应用于各种数据压缩技术中,是信息熵编码中的最佳编码方法之一。 变换编码广泛应用于各种图像数据压缩,它选择一种最佳变换,将初始数据从初始空间或时间域变换到一个更适于压缩的抽象域中,然后用反变换恢复原始数据。经过变换后,信息中最重要的部分易于识别并可能成组出现。 图像的变换编译码原理如图所示。 在发送端将原始图像分割成1~n个子图像块,每个子图像块送入正交变换器作正交变换,变换器输出变换系数经滤波、量化、编码后经信道传输到接收端,接收端完成解码、逆变换、综合拼接,恢复出空域图像。主要的正交变换包括傅立叶变换 语音信号压缩技术 多媒体语音信号的数字编码分为波形编码、参数编码和混合编码 波形编码是指编码系统直接对语音时频或时频波形样值进行编码。 波形编码系统的译码质量一般较高,因为它保留了信号原始样值的细节变化,从而保留了信号的各种过渡特征。但是波形编码的传输率较高,压缩比也不大。 典型的波形编码算法有脉冲编码调制、差分脉冲编码调制、自适应差分脉冲编码调制、子带编码等。 波形编码具有编码质量好、能保持原始语音波形等特点,因而在有线通信等一些要求比较高的场合得到广泛应用。 当需要对信源传输率进行较大程度压缩时,基于人类语音生成模型的参数编码算法比波形编码更为合适。 对于人耳(20~20000Hz)的听觉对发声时频率位置、各频率分量的大小比较敏感,但对信号在各频率点上的相位却不敏感,因此没有必要保持语音信号的波形完全一致。参数编码的基本思想是利用具有12~16参数的语音生成模型进行编码传输,接收方用这些参数合成出具有与原始语音接近的声音。参数编码的缺点是激励部分参数估计的误差导致合成出的声音质量较低,且伴有噪声。 混合编码结合波形编码的优点,既利用语音生成模型,通过对模型参量进行编码,减小波形编码中被编码对象的动态范围或数目;又使编码产生接近原始语音波形的合成语音,以保留说话人的各种自然特征,提高了合成语音质量。 混合编码的典型算法主要有码激励线性预测编码,以及基于它的各种改进算法。 如果想了解为什么混合编码比之前两种更好,那么请先了解此算法 多媒体的数据压缩标准JPEG及JPEG2000 JPEG利用视觉特性,使用量化和无损压缩编码相结合来去除冗余,是一种有损压缩算法。JPEG算法原理如图所示,编码时首先利用正向离散余弦变换(DCT)将图像由空间域变换到频率域;然后使用加权函数对DCT系统进行量化,此加权函数对于人的视觉系统是最佳的;最后利用霍夫曼变长编码对量化系数进行熵编码。 译码或者解压缩过程是压缩编码过程的逆过程。 JPEG压缩编码及解压缩算法原理图 JPEG压缩编码算法的主要计算过程如下。 (1)正向离散余弦变换。对每个单独的彩色图像分量,把整个分量图像分成8*8的图像块,并作为二维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。 DCT变换及其逆变换计算如下 (2)量化。量化是对经FDCT变换后的频率系数进行量化,目的是减小非“0”系数的幅度并增加“0”值系数的数量。量化是引起图像质量下降的最主要的原因。 (3)Z形编排。量化后对DCT系数进行重新编排,其目的是增加连续的“0”系数的数目,即“0”游程长度。编排的方法是

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档