第3章-音频信息处理技术.ppt

下载文档 降价啦

0
0
约6.29千字
约 58页
2018-04-13 发布于北京
举报
版权申诉
保障服务

第3章-音频信息处理技术.ppt

1、本文档共58页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第3章-音频信息处理技术.ppt

课程的基本框架多媒体信息处理技术音/视频压缩多媒体数据格式多媒体通信的网络技术重点掌握通信协议多媒体通信的用户接入技术多媒体通信的终端技术多媒体通信常见的应用系统第三章音频压缩 2.1 音频信号数字化 2.2 音频信号压缩编码算法 2.3 语音压缩编码标准 2.4 主要音频压缩应用------IP电话 2.1 音频信号数字化一、音频信号的特点二、信号的数字化过程采样：将信号在时间上离散化根据采样定理，采样频率应该大于等于2f 常用采样频率8、11.025、22.05、16、37.8、44.1、48kHz 量化：将每个采样值在幅度上进行离散化编码：用二进制来表示每个采样的量化值二、信号的数字化过程采样过程量化示意图（精度为8）按8位精度量化：振幅0~600，分为28=256个阶距，每个阶距为600/256≈2.4，即在2.4振幅之内的数都转化为同一二进制数。量化后采用自然二进制编码（精度为8）数据量： 8kHz*8bit=64kb/s 2.2 音频信号压缩编码算法音频压缩编码应该与信号数字化合二为一如果在采样的基础上采用均匀量化，然后采用自然二进制数表示，就是最简单、最方便的编码方式------PCM编码。如果在此三个步骤中进行变化，就形成各种各样的编码方式，每种编码方式都有不同的压缩比。本节学习主要看每种算法如何进行压缩编码方式：波形编码参数编码混合编码 1.增量调制一般增量调制输入信号与预测值比较，得出差值。若差值为正，则编码输出为1，若为负，则输出为0。每个抽样点只需一位编码自适应增量调制自适应变化量化阶距控制可变因子 M，使量化阶距在一定范围内变化。对于每一个新的采样，其量化阶距为其前面数值的M倍 2. 非均匀PCM（ A、μ律压扩方法）实现非均匀量化的方法之一是采用压缩扩张技术。压缩特性是：在最大信号时其增益系数为1，随着信号的减小增益系数逐渐变大。信号通过这种压缩电路处理后就改变了大信号和小信号之间的比例关系——大信号时比例基本不变或变化较小，而小信号则相应按比例增大。 1 μ律压扩特性 μ律压缩特性表示式为： 2 A律13折线压扩特性 ? 目前应用较多的是以数字电路方式实现的A律特性折线近似。具体实现的方法是：对x轴在0～1(归一化)范围内以1/2递减规律分成8个不均匀段，其分段点是1/2，1/4，1/8，1/16，1/32，1/64和1/128。对y轴在0～1(归一化)范围内以均匀分段方式分成8个均匀段，其分段点是1/8，2/8，3/8，4/8，5/8，6/8，7/8和1。将x轴和y轴对应的分段线在x-y平面上的相交点相连接的折线就是有8个线段的折线。 3.差分脉冲编码调制（DPCM）差值脉冲编码调制(DPCM)就是考虑利用语声信号的相关性找出可反映信号变化特征的一个差值量进行编码的。根据相关性原理，这一差值的幅度范围一定小于原信号的幅度范围。 DPCM不是对采样值进行编码，而是对差值进行编码。因此，在保持相同量化误差的条件下，量化电平数就可以减少，也就是压缩了编码速率. 4.自适应差分脉冲编码调制（ADPCM）为了能进一步提高DPCM方式的质量还需采取一些辅助措施，即自适应措施。为了能在相当宽的变化范围内仍能得到最佳的性能，DPCM也需要自适应系统，这里的自适应包括自适应预测和自适应量化，称为ADPCM。 5. 子带编码子带编码是首先将输入信号分割成几个不同的频带分量，然后再分别进行编码，这类编码方式称为频域编码。频域编码将信号分解成不同频带分量的过程去除了信号的冗余度，得到了一组互不相关的信号。这同DPCM方式的机理虽然不同，但从去除冗余度的角度来说这两者又是相似的。子带编码优点：首先，对不同的子带合理地分配比特数使误差谱的形状适应人耳听觉特性，获得更好的主观听音质量。能量集中在低频段，所以对低频段的子带用较多的比特数来表示，而高频段用比较少的比特。其次，各子带内的量化噪声相互间独立，被束缚在自己的子带内，这样就能避免输入电平较低的子带信号被其他子带的量化噪声所淹没。 6. 变换域编码与子带编码类似，变换域编码也是一种“频域”编码。事实上只有采用离散博里叶变换(FFT)或离散余弦变换(DcT)，变换后的各系数才真正代表频率分量。由于DCT接近最佳变换KLT，语音变换域编码基本部采用DCT，在这个意