语音信号处理第11章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理第11章

语音信号处理 Speech Signal Processing 第11章 语音编码(2)—声码器技术及 混合编码 声码器概念 通道声码器 同态声码器 线性预测声码器 混合编码 各种编码方法的比较及语音编码性能指标和质量评价 声码器的概念 2.同态声码器 3.线性预测声码器 混合编码 END * * 第1章 绪论 第2章 语音信号的声学基础及产生模型 第3篇 语音信号处理技术 与应用(10学时) 第2篇 语音信号分析 (14学时) 第1篇 语音信号处理基础(4学时) 第3章 时域分析 第4章 短时傅立叶分析 第5章 同态滤波及倒谱分析 第6章 线性预测分析 第7章 矢量量化 第8章 隐马尔可夫模型(HMM) 第9章 语音检测分析 第10章 语音编码(1)—波形编码 第11章 语音编码(2)—声码器及混合编码 第12章 语音合成 第13章 语音识别 第14章 说话人识别 第15章 语音增强 语音参数编码,即声码器,通过对语音信号的参数进行提取及编码,力图使重建语音信号具有尽可能高的可懂度,即保持原语音的语意,而重建信号的波形同原语音信号的波形可能会有相当大的差别。 它只要求得到的信号听起来与输入语音完全一样,而不必与输入波形相同。 优点:编码率低,2.4kbit/s甚至以下。 为了达到很低的传输码率,声码器只能提取和传输那些携带听觉上最重要部分的信息的参数,同时必须进行高效的编码。 缺点:合成的语音质量差,特别是自然度较低,不一定能听出讲话人是谁 典型的声码器:通道声码器、相位声码器、同态声码器以及目前广泛使用的线性预测(LPC)声码器 LPC声码器和通道声码器为研究最深入,使用最广泛的声码器, LPC声码器较好地解决了传输数码率与所得到的语音质量间的矛盾,比较有实用价值。 相位声码器早期常用,由于其语音质量不如LPC声码器而逐渐被淘汰。 同态声码器语音质量比LPC声码器好,但始终无法降低其数码率 整个滤波器输出的包络近似于语音的频谱包络 在发端,语音加于滤波器组和基音提取器上。 滤波器组将语音的频率范围分成许多相邻的频带或通道,滤波器的数目取决于不同的结构方式,一般14-20个以上 是早期广泛使用的声码器 1.通道声码器 通过边带信息,包括浊音、清音分类、基音周期等,来恢复语音信号的谐波结构,或者说是提供声门激励的信息。 通道声码器的输出语音的音质较差,听起来“电气”很重,明显混有正弦声、混响声、哨声、蜂音等。 但可懂度可做的很好,抗背景噪声能力也强,即顽健性好。 同态声码器的基础建立在语音信号的产生模型上,即是语音由声门激励和声道响应序列的卷积所产生,因此采用同态解卷方法来进行处理。 同态处理后,激励信息处于倒谱的高时域,而声道信息处于低时域,两者是相互分开的。 在同态声码器的分析部分,由倒谱c(n)分离出包含声道频谱包络信息的低时部分,同时由高时部分判断清浊音分类并提取基音周期 倒谱分析流图 在同态声码器中,每10-20ms计算一次倒谱, 从每一帧的倒谱高时部分估计基音周期和清/浊音信息;它们和倒谱的低时部分一起,经过量化和编码,送去传输和存储。 在接收端合成部分,传输过来的声门激励参数生成声门激励序列;从量化的低时段倒谱计算出近似的声道冲激响应,令二者直接卷积得到合成的语音信号。 激励信号 产生器 改变激励信号的选择原则,是合成语音尽可能接近原始语音。先分析输入语音,提取声道模型参数,然后选择激励信号激励声道模型产生合成语音,通过比较合成语音与原始语音的差别,选色最佳激励,得到最佳逼近原始语音的效果。 *

文档评论(0)

yaocen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档