语音频域分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音频域分析

1.实验目的 由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。 录入一段文字“Nothing is impossible”保存为wav格式,进行频域方面的处理分析。 2.利用短时傅立叶变换求短时谱 对第n帧语音信号xn(m)的短时傅立叶变换的定义如下: 由定义可知,短时傅立叶变换实际就是窗选语音信号的标准傅立叶变换,这里w(n-m)是一个“滑动的”窗口,它随n的变化而沿着序列x(m)滑动。令n-m=k,则得到 于是可以得到 假定 则可以得到 根据信号的时宽带宽积为一常数之一基本性质,可知主瓣宽度和窗口宽度成反比,N越大越窄。尤其是N值大于语音音素长度时已不能反应语音音素的频谱了。因此,应折衷选择窗的宽度N。另外,窗的形状也对短时谱有影响,如矩形窗,虽然频率分辨率很高,但由于第一旁瓣的衰减很小,所以不适合用于频谱成分很宽的语音分析中,而汉明窗在频率范围中分辨率较高,而且旁瓣衰减大,具有频谱泄露少的优点,所以在求短时频谱时一般采用汉明窗。图1与图2分别是不同窗长的汉明窗下的短时谱仿真图, 图1窗长为512 图2窗长为1024 附程序源码: clear a=wavread(3.wav); subplot(2,1,1), plot(a); grid N=512; h=hamming(N); for m=1:N b(m)=a(m)*h(m) end y=20*log(abs(fft(b))) subplot(2,1,2) plot(y);title(短时谱); grid 3.语谱图 谱图就是语音频谱图,一般是通过处理接收的时域信号得到频谱图,因此只要有足够时间长度的时域信号就可。(时间长度为保证频率分辨率) 语谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量。由于是采用二维平面表达三维信息,所以能量值的大小是通过颜色来表示的,颜色深,表示该点的语音能量越强。 语谱图的时间分辨率和频率分辨率是由窗函数的特性决定的。时间分辨率高,可以看出时间波形的每个周期及共振峰随时间的变化,但频率分辨率低,不足以分辨由于激励所形成的细微结构,称为宽带语谱图;而窄带语谱图正好与之相反。 图3 语谱图 图中可以看到明显的一条条横方向的条纹,我们称为“声纹”,有很多应用。条纹的地方实际是颜色深的点聚集的地方,随时间延续,就延长成条纹,也就是表示语音中频率值为该点横坐标值的能量较强,在整个语音中所占比重大,那么相应影响人感知的效果要强烈得多。而一般语音中数据是周期性的,所以,能量强点的频率分布是频率周期的。 附程序源码: a=wavread(3.wav); aFFT = abs(fft(a));%可以获得傅立叶谱幅度 aFFTdB = 20*log10(aFFT); %变成分贝值 image(aFFTdB) ; title(yupu); 4.复倒谱和倒谱 在语音信号处理的实际应用中,很多场合需要根据语音信号反过来求解声门信号或声道冲激响应。这就需要在知道卷积结果的基础上,利用“解卷”求得参与卷积的各个信号,同态处理是常用的解卷方法。由于语音信号进行同态分析后得到的是语音信号的倒谱参数,因此同态分析也叫倒谱分析。 复倒谱是x(n)的Z变换取对数后的逆Z变换,其表达式如下: 倒谱c(n)定义为x(n)取Z变换后的幅度对数的逆Z变换,即 在时域上,语音产生模型实际上是一个激励信号与声道冲激响应的卷积。对于浊音,激励信号可以由周期脉冲序列表示;对于清音,激励信号可以由随机噪声序列表示。声道系统相当于参数缓慢变化的零极点线性滤波器。这样经过同态处理后,语音信号的复倒谱,激励信号的复倒谱,声道系统的复倒谱之间满足下面的关系: 由于倒谱对应于复倒谱的偶部,因此倒谱与复倒谱具有同样的特点,很容易知道语音信号的倒谱,激励信号的倒谱以及声道系统的倒谱之间满足下面关系: 图4 不同窗的倒谱与复倒谱 倒谱基音检测中,语音加窗是很重要的,窗口的选择应该选择缓变窗。如果窗口选择矩形窗,在许多情况下倒谱中的基音峰将变得不清晰甚至消失。一般来讲,窗口函数选择汉明窗比较合理。 对语音信号进行倒谱与负

文档评论(0)

qwd513620855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档