语音信号处理(张力编)课件第三章(1).pptVIP

语音信号处理(张力编)课件第三章(1).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Windowing (frame) In short-term, non-stationary-stationary Non-linear-linear (10ms-25ms) ZCR Center-clipping technique 用途:静音检测(VAD)和舒适噪声(CNG)的生成 VAD: Voice Activity Detection CNG: Comfort Noise Generator 短时能量函数:对信号电平值过于敏感 容易溢出 短时平均幅度:清音和浊音、有声和无声的幅度 差不如短时能量明显。 各自存在的问题 1.过零率定义:信号跨越横轴的情况。 对于连续信号,观察语音时域波形通过横轴的情况; 对于离散信号,相邻的采样值具有不同的代数符号,也就是样点改变符号的次数。 t n 二、短时过零率分析 对于语音信号,是宽带非平稳信号,应考察其短时平均过零率。 sgn(x(n))=1 x(n)?0 sgn(x(n))= -1 x(n)0 sgn[.]为符号函数 3、短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 女声汉语拼音a的一帧信号(在采样频率为22050Hz的情况下,取20ms作为一帧),短时过零率为46。 男声汉语拼音s的一帧信号(在采样频率为22050Hz的情况下,取20ms作为一帧),短时过零率为183。 存在的问题:短时平均过零率容易受到A/D转换是的直流偏移、50Hz交流电源的干扰以及噪声的影响。 减少直流偏移方法: ①采用低直流偏移器件 ②软件去除 Bandpass filte Hb w Hb(ejw) x(n) y(n) 减少电源干扰的方法:①一种是采用带通滤波 ②是用过门限率来修改过零率,减少随机噪声的影响。 过门限率反映了穿过正负门限的次数,如果存在随机噪声,只要信号没有超过[-T,T]的范围,就没有有过零率产生。 T -T 1.短时自相关函数的定义 (1)说明当时域信号为周期信号时,自相关函数也是周期性函数,两者具有同样的周期。 (2)Rn(k)为偶函数, Rn(k)=Rn(-k) (3)Rn(0)最大, Rn(0)? |Rn(k)|, Rn(0)=En。 三、短时相关分析 正弦波周期信号 正弦波周期信号的自相关函数波形 * * 第3章 语音信号分析 §3.2 语音信号的数字化和预处理 §3.3 语音信号的时域分析 §3.4 语音信号的频域分析 §3.5 语音信号的倒谱分析 §3.6 语音信号的线性预测分析 §3.2 语音信号的数字化和预处理 一、预滤波、采样和A/D转换 二、预处理 1.预滤波的作用: 防止混叠; 抑制50Hz的电源工频干扰。 预滤波器是一个带通滤波器,一般情况下,上、下截止频率为: fL=60~100Hz ,fH=3400Hz 。 一、预滤波、采样和A/D转换 t n xa(nT) xa(t) 2.采样: 将时间连续信号变成时间离散信号。 采样频率通常为fs=8kHz。 Ideal sampling and real sampling 3. A/D转换 采样 量化 xa(t) xa(nT) x(n) xa1 x1 xk xak xak+1 xk+1 xL xaL xaL+1 x(n)=Q[xa(nT)] ? 截尾量化 舍入量化 截掉b位后数据 视b+1位后数据的大小决定b位数据的值 量化误差(噪声) e(n)=x(n)- xa(nT) -?/2 ? e(n) ? ?/2 1 |e(n)| ? ?/2 ? 0 其他 (1)假设量化噪声是平稳的白噪声过程 (2)假设量化噪声与输入信号不相关,有 E[e(n)x(n+m)]=0 m为任意值 (3)在每个量化间隔上,量化噪声均匀分布,有 Pe(e(n))= 量化信噪比 量化噪声的信噪比:SNR=?x2/?e2 ?x2语音信号序列的方差, ?e2噪声序列的方差, 用分贝表示,SNR=10log(?x2/?e2) SNR =signal to noise rate =signal’s energy / noise’s ene

文档评论(0)

wxc6688 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档