数字语音编码技术精品.pptVIP

下载本文档

8
0
约2.81千字
约 40页
2016-02-20 发布于湖北
举报
版权申诉

数字语音编码技术精品.ppt

1、本文档共40页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

自相关法 3.混合编码介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编码的一些特征。波形编码+参数编码可在4----16kbit/s范围内达到良好的语音质量清/浊转换声道模拟滤波器基音周期脉冲序列发生器随机噪声发生器输出语音s(n) LPC系数增益 ? x(n) u(n) LPC 语音合成图 CELP 语音合成示意图 AMR 发送端接收端解码器 * * 第一节课数字语音编码多媒体数字信号编解码器 COder 和 DECoder 作用：对视频、音频信号进行压缩和解压 IP网络语音处理过程 PCM PCM的产生脉冲编码调制—将模拟调制信号的采样值变换为脉冲码组。PCM编码包括如下三个过程。抽样：将模拟信号转换为时间离散的样本脉冲序列。量化：将离散时间连续幅度的抽样信号转换成为离散时间离散幅度的数字信号。编码：用一定位数的脉冲码组表示量化采样值。抽样模拟声音在时间上是连续的，而数字音频是一个数字序列，在时间上只能是断续的。因此当把模拟声音变成数字声音时，需要每隔一个时间间隔在模拟声音波形上取一个幅度值，称之为采样（抽样），采样的时间间隔称为采样周期（倒数为采用频率）抽样量化在数字音频技术中，把采样得到的表示声音强弱的模拟电压用数字表示。模拟电压的幅值仍然是连续的，而用数字表示音频幅度时，只能把无穷多个电压幅度用有限个数字表示，即把某一幅度范围内的电压用一个数字表示，这称之为量化量化和编码为什么要使用CODEC？ *采样频率是指单位时间内的采样次数。 *奈奎斯特（Harry Nyquist）采样理论：只要采样频率f(1/T)高于输入信号最高频率的两倍，则经过采样后的采样信号能够包含原模拟信号的全部信息，且经过反变换和低通滤波后可不失真地恢复原模拟信号。 *电话话音的信号频率约为3.4 kHz，采样频率就选为8 kHz。以8kHz的频率对语音信号进行采样。PCM中每个采样点用16位来表示，那么一秒钟要传输： 16 × 8000 ＝ 128000（b）也就是要达到128kps的传输速率，才可以传送一路语音信号。因此必须对语音信号进行压缩。语音压缩就是要去除传输信号的冗余信息。语音压缩——去除语音信号样本的冗余信息客观冗余－－信号本身特征 (1)语音信号样本间的相关性很强(8kHz时两点相关0.85) (2)浊音段的准周期性 (3)声道的形状及其变化比较慢 (4)静止系数(语音间隔，有静音期) 主观冗余－－人的听觉特性听觉掩蔽特性听不到或不灵敏的语音分量视为冗余语音编码分类根据编码器的实现机理，分成三大类波形编码参数编码混合编码 1、波形编码从语音信号的波形出发，对波形的抽样值、预测值、预测误差进行编码，它以重建语音波形为目的，力图使重建波形接近原信号波形。特点：利用抽样定理，恢复原始信号的波形优点：适应能力强，重建语音质量好缺点：编码速率较高类型： PCM，自适应增量调制（ADM），自适应差分编码调制（ADPCM），自适应预测编码APC 速率通常在16------64kbit/s范围非均匀量化进行压缩均匀量化与非均匀量化非均匀量化对小信号采用小的量化间隔，对大信号采用大的量化间隔，这样可以用较少的位数编码。对大信号来说，虽然绝对量化误差较大，但是因为：（1）大信号出现的机会不多，（2）信噪比（相对误差）与小信号是一致的，所以对总的话音质量影响不大。非均匀量化也是一种压缩。（如PCMU和PCMA，每个样本的精度为8位，输出的数据率为64 kb/s ） 2.参数编码提取语音的一些特征信息进行编码，在收端利用这些特征参数合成语音。优点：编码速率低。缺点：语音的音质和自然度较差，很难辨别说话人。（有一定的可懂度) 类型:LPC线性预测编码速率通常是在4.8kbit/s以下话音的形成原理肺中的空气受到挤压形成气流，气流通过声门（声带）沿着声道（由咽、喉、口腔等组成）释放出去，就形成了话音。气流、声门可以等效为一个激励源，声道可以等效为一个时变滤波器（共振峰）。话音信号具有很强的相关性（长期相关、短期相关）。等效为激励源＋声道＋喇叭口话音的分类浊音（voiced sounds）：声道打开，声带在先打开后关闭，气流经过使声带要发生张驰振动，变为准周期振动气流。浊音的激励源被等效为准周期的脉冲信号。清音（unvoiced sounds）：声带不振动，而在某处保持收缩，气流在声道里收缩后高速通过产生湍流，