语音信号处理实验二.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理实验二.doc

实验? 语音信号的实验目的在理论学习的基础上,进一步理解和掌握语音信号短时分析的意义方法。原理 语音信号的能量分析是基于语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。定义短时平均能量 下图说明了短时能量序列的计算方法,其中窗口采用的是直角窗。 过零就是信号通过零值。对于连续语音信号,可以考察其时域波形通过时间轴的情况。而对于离散时间信号,如果相邻的取样值改变符号则称为过零。由此可以计算过零数,过零数就是样本改变符号的次数。单位时间内的过零数称为平均过零数。 语音信号x(n)的短时平均过零数定义为 式中,是符号函数,即 短时平均过零数可应用于语音信号分析中。发浊音时,尽管声道有若干个共振峰,但由于声门波引起了谱的高频跌落,所以其语音能量约集中干3kHz以下。而发清音时.多数能量出现在较高频率上。既然高频率意味着高的平均过零数,低频率意味着低的平均过零数,那么可以认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。然而这种高低仅是相对而言,没有精确的数值关系。 实验步骤 语音信号的录音、读入、放音等:利用函数wavread对语音信号进行采样,记住采样频率和采样点数,给出以下语音的波形图(2.wav)。 程序: x=wavread(2.wav); Fs=10000; nbits=80; [x,Fs,nbits]=wavread(2.wav); wavplay(x,10000); soundview(x,10000); 短时能量分析:(1)首先对语音信号预加重;(2)对预加重后的语音信号进行分帧,帧长取N=256个样值点,帧移取128个样值点;(3)求短时能量。 程序:x=wavread(2.wav); z=filter([1-0.9375],1,x); y=enframe(z,256,128); m1=sum(abs(y),2); m2=sum(y.*y,2); m3=sum(log(y.*y+eps),2); figure(1); subplot(3,1,1),plot(m1) subplot(3,1,2),plot(m2) subplot(3,1,3),plot(m3) 短时过零率分析:求语音信号的短时过零率。 程序:[x,fs,nbit]=wavread(2.wav); x=x/max(abs(x)); len=256; inc=128; tmp1=enframe(x(1:end-1),256,128); tmp2=enframe(x(2:end),256,128); signs=(tmp1.*tmp2)0; diffs=(tmp1-tmp2)0.02; zor=sum(signs.*diffs,2) figure; subplot(2,1,1),plot(x) subplot(2,1,2),plot(zor) 编写程序:参考Matlab有关资料,设计并编写出上述程序注明语音段和所用窗函数及其宽度。 z=filter([1-0.9375],1,x); inc=128; len=256; y=enframe(z,len,inc); amp1=sum(abs(y),2); tmp1=enframe(x(1:end-1),256,128); tmp2=enframe(x(2:end),256,128); signs=(tmp1.*tmp2)0; diffs=(tmp1-tmp2)0.02; zor=sum(signs.*diffs,2); figure; subplot(3,1,1),plot(x) subplot(3,1,2),plot(amp1) subplot(3,1,3),plot(zor) 结论:4000之前的是清音,之后的是浊音。清音的短时能量小,浊音的短时能量大。清音的短时过零率大,浊音的短时过零率小。语音段为第二段,为矩形窗。 换一段语音重复上述步骤。 程序:[x,fs,nbit]=wavread(8.wav); soundview(x,10000); z=filter([1-0.9375],1,x); inc=128; len=256; y=enframe(z,len,inc); amp1=sum(abs(y),2); tmp1=enframe(x(1:end-1),256,128); tmp2=enframe(x(2

文档评论(0)

dmz158 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档