- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档
精品文档
随意编辑
随意编辑
实验二语音信号的特征提取
实验目的
熟练运用 MATLAB 软件进行语音信号实验。
熟悉短时分析原理、 MFCC 的原理。
学习运用 MATLAB 编程进行 MFCC 的提取。
、学会利用短时分析原理提取 MFCC 特征序列。
实验仪器设备及软件
MATLAB
实验原理
MFCC
语音识别和说话人识别中,常用的语音特征是基于 Mel 频率的倒谱系数(即 MFCC ) 。
MFCC 参数是将人耳的听觉感知特性和语音的产生机制相结合。
Mel 频率可以用如下公式表示:
fMel 2595 log(1 f / 700)
在实际应用中, MFCC 倒谱系数计算过程如下 ;
将信号进行分帧, 预加重和加汉明窗处理, 然后进行短时傅里叶变换并得到其频谱。
求出频谱平方,即能量谱,并用 M 个 Mel 带通滤波器进行滤波;由于每一个频带
中分量的作用在人耳中是叠加的。 因此将每个滤波器频带内的能量进行叠加, 这时第 k ,.
个滤波器输出功率谱 x ( k) 。
将每个滤波器的输出取对数, 得到相应频带的对数功率谱; 并进行反离散余弦变换,
得到 L 个 MFCC 系数,一般 L 取 12~16 个左右。 MFCC 系数为
MCn logx(k)cos[ (k 0.5)n/M], n=1,2,…,L
k 1
④将这种直接得到的 MFCC特征作为静态特征,再将这种静态特征做一阶和二阶差
分,得到相应的动态特征。
LPC
由于频率响应H (ejw)反映声道的频率响应和被分析信号的谱包络,因此用
log | H (ejw) |做反傅里叶变换求出的 LPC倒谱系数。
p
通过线性预测分析得到的合成滤波器的系统函数为 H (z) 1/(1 az i),其冲激响
i 1
应为h(n)。h(n)的倒谱为h(n) ,
应为h(n)。h(n)的倒谱为h(n) , H (z)
h(n)z n
n 1
就是说H (z)的逆变换
h(n)是存在的。
设 h(0) 0
将式H(z)
h(n)z n 两边同时对 z 1求导
n 1
一 1 1-
一 1 1
-log[-p ]
1 aiz1
i 1
—h(n)z n 得到 nh(n)z z n 1 n 1
P
?一. i 1
iaiz
,于是有
1 az i
i 1
(1p A1
(1
p A
1、
aiz ) n h(n)z
i 1 n 1
iaiz i 1令其左右两边 n 1
z的各次哥前系数分别相等,得
到h(n)和ai间的递推关系
h(1) a1a
h(1) a1
a n 1 a
h(n) an (1 )ai h(n k),1
i 1 n
A p A
h(n) (1 )ai h(n 1), n
i 1 n
n P
,按其可直接从预测系数
P
ai}求得倒谱
h(n)。这个倒谱是根据线性预测模型得到的,又称为 LPC倒谱。LPC倒谱由于利用线性预
测中声道系统函数 H (z)的最小相位特性,因此避免了一般同态处理中求复对数的麻烦。
四、实验步骤及程序
MFCC特征序列
(1)、实验步骤
①输入样本音频
②给样本音频预加重、分帧、加窗
③ 将处理好的样本音频做傅里叶变换
④进彳T Mel频率滤波
⑤进彳T Log对数能量
⑥对样本求倒谱
⑦输出MFCC图像
(2)、MFCC提取程序流程图
图3.1 MFCC特征提取
(3)、MFCC特征提取实验源程序
close all
clear
clc
[x]=wavread( 1.wav);
bank=melbankm(24,256,8000,0,0.5, m);
bank=full(bank);
bank=bank/max(bank(:));
for k=1:12
n=0:23;
dctcoef(k,:)=cos((2*n+1)*k*pi/(2*24));
end
w = 1 + 6 * sin(pi * [1:12] ./ 12);
w = w/max(w);
xx=double(x);
xx=filter([1 -0.9375],1,xx);
xx=enframe(xx,256,80);
for i=1:size(xx,1)
y = xx(i,:);
s = y .* hamming(256);
t = abs(fft(s));
t = t.A2;
c1=dctcoef * log(bank * t(1:129));
c2 = c1.*w;
m(i,:)=c2;
end
figure
plot(m);xlabel(帧数);ylabel(幅度);title( MFCC);
五、实验结果与分析
MFCC
MFCC
0 20 40 60 80 100 120 140 160 1S0 200
帧数
图3.3 MFCC特
文档评论(0)