lecture10-音频压缩摘要.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体技术基础-数据压缩 多媒体技术基础-音频压缩 向辉 山东大学计算机学院 2009年秋季 本章内容 数据压缩概念 无损压缩算法 数字音频压缩 数字图象压缩 MPEG系列标准 音频编码压缩 音频数据的编码一般分为两个方面 语音数据的编码 语音数据具有特定的属性可以用来提高压缩率 ITU-TSS为此制定了并且继续制定一系列话音(speech)数据编译码标准包括:G.711,G.721,G.722,G.723,G.723.1,G.728,G.729和G.729.A等 音乐和一般的声音的编码 允许一定程度的有损压缩 生理声学(Psychoacoustic)模型 脉冲编码调制(PCM) 编码原理比较直观和简单 输入是模拟声音信号 输出是PCM样本 编码步骤包括: 带通滤波器(band-limiting filter) 编码压缩器(Compressor):采样 量化器:均匀量化或非均匀量化 PCM-均匀量化 PCM-非均匀量化 PCM-μ律算法 PCM-A律算法 差分脉冲编码调制(DPCM) differential pulse code modulation 利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术 思路:根据过去的样本去估算(estimate)下一个样本信号的幅度大小,称为预测值,然后对实际信号值与预测值之差进行量化编码,由于差值的取值的动态范围小了很多,因此就减少了表示每个样本信号的位数 三阶 DPCM ADPCM Adaptive Differential PCM 核心想法 利用自适应的思想改变量化阶的大小,即使用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值:variable quantization levels 使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小:variable predictor coefficients 子带编码(SBC) 子带编码(Subband Coding,SBC) 核心想法 使用一组带通滤波器(band-pass filter,BPF)把输入音频信号的频带分成若干个连续的频段,每个频段称为子带。对每个子带中的音频信号采用单独的编码方案去编码。 在信道上传送时,将每个子带的代码复合起来。在接收端译码时,将每个子带的代码单独译码,然后把它们组合起来,还原成原来的音频信号。 子带编码(SBC)-优势 对每个子带信号分别进行自适应控制 量化阶(quantization step)的大小可以按照每个子带的能量电平加以调节。具有较高能量电平的子带用大的量化阶去量化,以减少总的量化噪声 可根据每个子带信号在感觉上的重要性,对每个子带分配不同的位数,用来表示每个样本值 例如,在低频子带中,为了保护音调和共振峰的结构,就要求用较小的量化阶、较多的量化级数,即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的位数。 Subband ADPCM 线性预测编码(LPC) Linear Predictive Coding (LPC) 语音由声道产生,语调、周期与幅度等参数可以决定语音感知效果 人类语音由一系列音节组成,如 /i/ as in “heed:, /I/ as in “hid”, /l/ as in “lot” 等,这些音节的绝大多数能量集中在2-3 KHz频带 基本思想:LPC是通过分析话音波形来产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少 Linear Predictive Coding (LPC) 通过一个离散的随时间变化的时变线性滤波器代表人的话音生成系统模型,既当作预测器使用,又当作合成器使用 LPC作为声道发声模型,包括voiced sound (vocal cords)与white noise (mouth tube)发生器 Filter coefficients Excitation type Excitation energey pitch 一般编码速率在1200-2400 bps,声音效果robotic LPC 码激励线性预测(CELP) Code Excited Linear Predictor (CELP) LPC:预测信号与原信号s(n)相减得到的误差信号e(n)与有关参数一并编码传送,在解码端进行误差修正可有效改善语音质量 CELP:对一定时间内误差信号可能出现的各种值的组合按一定规则排列构成一个码本向量,采用向量量化(Vector Quantization)技术进行编码 编码时从本地码本中搜索出一组最接近的误差信号,然后对该组误差信号对应的地址编码并传送 解码端也设置一个同样的码本,按照接收到的

文档评论(0)

麻将 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档