实验2 语音信号谱分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、实验目的 理解语音信号的功率谱、倒谱; 理解语音信号的谱分析方法; MATLAB实现语音信号的谱分析。 二、实验原理 短时傅里叶分析 傅里叶分析在信号处理中具有十分重要的作用,它 是分析线性系统和平稳信号稳态特性的强有力手段。 稳态的语音的产生模型由线性系统组成,此系统被 一随时间作周期变化或随机变化的源所激励,因而系统 输出频谱反映了激励与声道频率响应特性。 语音波是一个非平稳过程,对语音处理来说,短时 分析是一种有效的解决途径。应用在傅里叶分析就是短 时傅里叶变换(STFT)。 短时傅里叶变换函数(tfrstft) 格式: [tfr,t,f]=tfrstft(x) tfrstft(x,t) tfrstft(x,t,N) tfrstft(x,t,N,h) 输出:tfr:返回信号的时域值 t:时间坐标 f:频率坐标(归一化) 输入: N:频率点的数目 h:窗函数 短时傅里叶变换的语音识别 分析单词“train”的语音信号(该语音文件是MATLAB本身特有的),样本长度为338,采样频率为1KHZ。 %读入语音信号 load train; t=0:337; %样本长度 fs=1000; %采样频率 %绘制时域波形 subplot(2,2,1) plot(t, train) xlabel(时间 t); ylabel(幅值 A); %计算功率谱 nfft=10240; dsp=abs(fft(gabor,nfft)); %绘制功率谱图 subplot(2,2,2) plot((0:nfft/2-1)/nfft*fs,dsp(1:nfft/2)) xlabel(频率 f) ylabel(功率谱 dsp) %计算短时傅里叶变换 h=window(hamming,85); [tfr,t,f]=tfrstft(gabor,1:338,256,h); %绘制等高线图 subplot(2,2,3) contour(t,(0:127)/256*fs,abs(tfr(1:128,:)).^2) xlabel(时间 t) ylabel(频率 f) %绘制三维图像 subplot(2,2,4) mesh(t,(0:127)/256*fs,abs(tfr(1:128,:)).^2) xlabel(时间 t) ylabel(频率 f) zlabel(幅值 A) 倒谱分析原理 同态信号处理也称为同态滤波,实现将卷积关系变 换为求和关系的分离处理,即解卷——各卷积分量分开。 将语音信号的声门激励信息及声道响应信息分离开来, 从而求得声道共振特征和基音周期,用于语音编码、合 成和识别。 对语音信号进行同态分析后得到其倒谱参数,所以 同态分析也称为倒谱分析。 同态信号处理的基本原理 语音信号不是加性信号,而是乘积性或卷积性信号,它不能用线性系统,而必须用满足其相应组合原则的非线性系统来处理。 同态信号处理就是将非线性问题转化为线性问题来处理。 乘积同态处理 卷积同态处理 卷积同态处理 同态处理理论的一个重要是任何同态系统都能表示为三个同态系统得级联,即同态系统可分解为两个特征系统和一个线性系统。 第一个系统以若干信号的卷积组合作为其输入,并将它变换成对应输出的相加性组合。 第二个系统是一个普通线性系统,它服从叠加原理。 第三个系统是第一个系统的逆变换,即将信号的相加性组合反变换为卷积组合。 同态信号处理 设输入信号 x(n)=x1(n)*x2(n) (x1(n)、x2(n)分别是声门激励和声道响应序列) 第一个特征系统将卷积信号转化为加性信号: 1、首先Z变换,将卷积信号转变为乘积性信号 Z[x(n)]=X(z)=X1(z).X2(z) 2、然后进行对数运算,将乘积运算转变为加性运算 3、最后进行逆变换,将其转变为时域信号 线性系统 经过第一个系统处理的输入信号已是加性信号,利用第二个线性系统对数据进行相应处理,处理后的结果交由第三个逆特征系统处理。 逆特征系统 首先将线性系统输出的加性信号 进行Z变换得: 然后进行指数运算,得到乘积性信号 最后进行逆Z变换,得到卷积性的语音恢复信号 y(n)

文档评论(0)

kehan123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档