第09讲音频编码技术.ppt

多媒体通信技术:音频编码技术 信息科学与工程学院 宁波大学 Ningbo University G.728 该标准利用低延时码本激励线性预测 LD-CELP 方法将一 般语音信号压缩至 16Kb/s 。 CELP 编码综合了 波形编码 和 参数编码 ,还采用 矢量量 化 的压缩算法。 CELP 实际上是一个闭环 LPC 系统,由输入语音信号确 定最佳参数,再根据某种最小误差准则从码本中找出最佳激 励码本矢量。 CELP 具有较强的抗干扰能力,在 4~ 16kbit/s 传 输速率下,即可获得较高质量的语音信号。 G.728 、 G.729 、 G.723.1 ● 混和编码标准 多媒体通信技术:音频编码技术 信息科学与工程学院 宁波大学 Ningbo University G.729 低码率的语音压缩标准,采用共轭结构代数码本激励线 性预测 CS-ACELP ,将语音信号压缩至 8Kb/s 。 G.723.1 采用 ACELP 算法,根据激励码本的不同可以将一般语音 信号压缩至 5.3Kb/s 和 6.3Kb/s 。 在 6.3Kb/s 编码器内采用了多脉冲激励,可以得到较高的 音质。 多媒体通信技术:音频编码技术 信息科学与工程学院 宁波大学 Ningbo University MPEG-1 、 MPEG-2 BC ● MPEG 音频编码标准 ● MPEG-2 AAC 编码标准 ● MPEG-4 音频标准 多媒体通信技术:音频编码技术 信息科学与工程学院 宁波大学 Ningbo University MPEG1 音频压缩标准 包括 3 种压缩模式:层次 1 、 2 、 3 ;向下兼容;压缩算法 主要由 子带划分和变换编码 构成,主要步骤为: (1) 音频信号通过滤波器组分成为 32 个子带; (2) 用 FFT 将子带变换到频率域; (3) 利用生理声学模型对能感知的噪声阈值进行估计; (4) 根据对噪声阈值的估计进行比特分配和量化。 编码器 解码器 多媒体通信技术:音频编码技术 信息科学与工程学院 宁波大学 Ningbo University ? 其音频编码分为 3 层: Layer-1 、 Layer-2 和 Layer- 3 。 Layer-1 的压缩比为 1:4 ,编码速率为 384kb/s ; Layer-2 的压缩比为 1:6 ~ 1:8 之间,编码速率为 192 ~ 256kb/s ; Layer-3 的压缩比为 1:10 ~ 1:12 , 压缩码率可以达到 64kb/s 。 – Layer-1 的编码器最为简单,主要用于 小型数字盒式磁 带 ; – Layer-2 编码器的复杂程度是中等,主要用于 数字广播 音频、数字音乐、只读光盘交互系统和视盘 ; – Layer-3 的编码器最为复杂,主要用于 ISDN 上的声音传 输 。 多媒体通信技术:音频编码技术 信息科学与工程学院 宁波大学 Ningbo University MPEG-2 BC 声音标准是在 MPEG-1 的基础上发 展来的,是 MPEG 为多声道声音开发的低码率编码 方案,并与 MPEG-1 的声音标准保持后向兼容。与 MPEG-1 相比主要增加了下面几个方面的内容: MPEG-2 BC 声音压缩标准 – 支持 5.1 多路环绕立体声 : 5 个全带宽声道,分为左、右、 中、和两个环绕声道,另加一个低频效果增强声道扩展 了编码器的输出范围,从 32 ~ 384kb/s 扩展到 8 ~ 640kb/s 。 – 增加了更低的取样频率和低码率:在保持 MPEG-1 原有的 取样频率的基础上,又增加了三种取样频率,新增的取 样频率为 16kHz 、 22.05kHz 和 24kHz ,是将原有 MPEG-1 的取样频率降低了一半,以便提高码率低于 64kb/s 时的 每个声道的声音质量。 第 09 讲 音频编码技术 多媒体通信技术:音频编码技术 信息科学与工程学院 宁波大学 Ningbo University 一切能发出声音的物体称为 声源 。声音是由于声源的振动 而产生的,由于声源的振动,借助于它们周围的介质, 把这种振动以机械波的形式由近及远地传向远方, 这就 是 声波 。 声波传入人耳,致使耳膜也产生振动,这种振动 被传导到听觉神经,人们就产生了“声音”的感觉。我们 日常听到的声音

文档评论(0)

1亿VIP精品文档

相关文档