网站大量收购独家精品文档,联系QQ:2885784924

语音信号处理作业.doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理作业

华南理工大学 《语音信号处理》作业报告 姓名: 学号: 班级:10级电信5班 日期:2013年5 月24日 1.实验要求 编程实现: 作业1、提取一段语音信号的短时能量、过零率、短时平均幅度差。 作业2、提取一段语音的傅里叶变换幅度谱、线性倒谱、梅尔频率倒谱(MFCC)。 作业3、 提取一段语音的LPC参数。 作业4、 估计一段语音的基音频率。 作业5、 估计一段语音的前3个共振峰频率。 作业1: 1、实验原理 (1)、短时能量 语音和噪声的区别可以体现在它们的能量上,语音段的能量比噪声段能量大,语音段的能量是噪声段能量叠加语音声波能量的和。在信噪比很高时,那么只要计算输入信号的短时能量或短时平均幅度就能够把语音段和噪声背景区分开。这是仅基于短时能量的端点检测方法。 信号{x(n)}的短时能量定义为: 语音信号的短时平均幅度定义为: 其中w(n)为窗函数。 (2)、短时平均过零率 短时过零表示一帧语音信号波形穿过横轴(零电平)的次数。过零分析是语音时域分析中最简单的一种。对于连续语音信号,过零意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值的改变符号称为过零。过零率就是样本改变符号次数。 信号{x(n)}的短时平均过零率定义为: 式中,sgn为符号函数,即: 过零率有两类重要的应用:第一,用于粗略地描述信号的频谱特性;第二,用于判别清音和浊音、有话和无话。从上面提到的定义出发计算过零率容易受低频干扰,特别是50Hz交流干扰的影响。解决这个问题的办法,一个是做高通滤波器或带通滤波,减小随机噪声的影响;另一个有效方法是对上述定义做一点修改,设一个门限T,将过零率的含义修改为跨过正负门限。 于是,有定义: 2、实验结果及讨论 本次实验选取语音文件phrase.WAV,运行程序,结果如下图: 3、实验代码 [x,fs,nbits]=wavread(E:\yuuyin\phrase.WAV); x = x / max(abs(x));%幅度归一化到[-1,1] %参数设置 FrameLen = 256; %帧长 inc = 90; %未重叠部分 amp1 = 10; %短时能量阈值 amp2 = 2; zcr1 = 10; %过零率阈值 zcr2 = 5; %计算过零率 tmp1 = enframe(x(1:end-1), FrameLen,inc); tmp2 = enframe(x(2:end) , FrameLen,inc); signs = (tmp1.*tmp2)0; diffs = (tmp1 -tmp2)0.02; zcr = sum(signs.*diffs,2); %计算短时能量 amp = sum((abs(enframe(filter([1 -0.9375], 1, x), FrameLen, inc))).^2, 2); subplot(3,1,1) plot(x) axis([1 length(x) -1 1]) xlabel(帧数);ylabel(Speech); subplot(3,1,2) plot(amp); axis([1 length(amp) 0 max(amp)]) xlabel(帧数);ylabel(Energy); subplot(3,1,3) plot(zcr); axis([1 length(zcr) 0 max(zcr)]) xlabel(帧数);ylabel(ZCR); 作业2、3: 提取一段语音的傅里叶变换幅度谱 [x]=wavread(E:\yuuyin\monologue speech_male.wav); y=fft(x); %傅里叶变换函数 plot(abs(y)); %振幅频率 title(傅里叶变换幅度谱); 提取一段语音的线性倒谱和LPC参数 基本原理: 由于频率响应反映声道的频率响应和被分析信号的谱包络,因此用做反傅里叶变换求出的LPC倒谱系数。 通过线性预测分析得到的合成滤波器的系统函数为,其冲激响应为h(n)。h(n)的倒谱为,就是说的逆变换是存在的。设,将式两边同时对求导,得得到,于是有 令其左右两边z的各次幂前系数分别相等,得到和间的递推关系 ,按其可直接从预测系数{}求得倒谱。这个倒谱是根据线性预测模型得到的,又称为LPC倒谱。LPC倒谱由于利用线性预测中声道系统函数H(z)的最小相位特性,因此避免了一般同态处理中求复对数的麻烦。 实验结果分析: 选取语音文件monologue speech_female,先读出原始语音文件的波形:

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档