- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
音频编解码技术 培训目标 了解音频编解码的目的 熟悉音频编解码的各种标准 知道音频编解码的技术构成 关注音频编解码技术的发展 语音编解码概述 (a) 波形编码器; (b) 声码器; (c) 混合编码器 语音编解码概述 (a) 波形编码器 不利用生成语音信号的任何知识来产生一种重构信号,波形编码器会尽可能重构出包括背景噪音在内的模拟波形。由于波形编码器作用于所有输入信号,因此会产生高质量的样值。特点是复杂度低,在数据速率16kb/s以上时,质量很好,例如, ITU-T G.711规范(PCM)用的比特率为64kbps。 Time domain approach: PCM (pulse code modulation), DPCM, ADPCM Frequency domain approach: SBC(sub-band coding), ATC(adaptive transform coding) 语音编解码概述 (b) 声码器声码器(vocoder)也称为音源编译码器,它试图在话音波形信号中提取生成话音的参数,通过这些参数和话音生成模型重构出语音。线性预测编码(LPC)用来获取一时变数字滤波器的参数。这个滤波器用来模拟说话人的声道输出。 声码器 (vecoder) 时变滤波器 (time-varying filter) 命令 基本激励 它的音质很低,增加数据率对提高音质基本无用, 广泛用于军事保密通讯. 语音编解码概述 试图填补波形编码和音源编码的间隔: waveform coding不能解决低于16kb/s下的音质问题, source coding可压缩到2.4kb/s或更低,但音质不自然。 时域合成-分析编码器(analysis-by-synthesis, ABS)。它和音源编码器的主要区别: 不使用2个状态(有声/无声)的模型来寻找滤波器的输入激励信号,而是要寻找这样一种激励信号,使得这种信号产生的波形尽可能接近原始话音波形. 语音编解码概述 (c) 混合编码器目前常用的语音编码器是混合编码器,它融合了波形编码器和声码器的长处。它的另一特点是它工作在非常低的比特率(4~16 kbps)。混合编码器采用合成分析(AbS)技术。 (c.1)线性预测合成分析编码器: 前向自适应LPAS编码器:8 kbps G.729编码器和 6.3 kbps 与5.3 kbps G.723.1编码器 后向自适应LPAS编码:16 kbps G.728低时延码激 励线性预测 (c.2)参数语音编码器:2.4 kbps 混合激励线性预测编码 语音编解码概述 语音编码器的主要功能就是把用户语音的PCM(脉冲编码调制)样值编码成少量的比特(帧)。这种方法使得语音在链路产生误码、网络抖动和突发传输时具有鲁棒性(Robustness)。在接收端,语音帧先被解码为PCM语音样值,然后再转换成语音波形。 语音编解码概述 帧大小: 帧的大小表示语音流量的时间长度,也称为帧时延。帧是语音信号的分立部件,且每帧是根据语音样点更新的。本章所介绍的编解码器都是一次处理一帧。每帧信息放在各语音分组中,并传送给接收端。 处理时延: 它表示在编解码器中对一帧语音做编码算法处理时所需的时间。它通常简单的计入帧时延。处理时延也称为算法时延。 前视时延: 编码器为了对当前帧的编码提供帮助而检查下一帧的一定长度,此长度就称为前视时延。前视的想法是为了利用相邻语音帧之间的密切相关性。 帧长度: 这个值表示经编码处理后的字节数(不包括帧头)。 语音编解码概述 语音比特率: 当编解码器的输入是标准脉冲编码调制的语音码流(比特率为64 kbit/s)时,编解码器的输出速率。 DSP MIPS: 此值是指支持特定编码器的D S P处理器的最低速度。 RAM需求: 它描述了支持特定的编码过程所需要RAM的大小。 编码器工作所需的时间: 是指编码器的缓存及处理时间,称为单向系统时延。其值=帧大小+ 处理时延+ 前视时延。显然,解码时延也非常重要。实际上,解码时延大约是编码时延的一半。 音频编解码标准 语音编解码标准 其它音频编解码标准 DTMF Transmitters and
文档评论(0)