- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语谱图
基于信号分析与处理的语谱图显示
1 语谱图
语音的发音过程中, 声道通常都是处于运动状态的, 因此它的共振峰特性也是时变的。不过这个时变过程比起振动过程来说要缓慢得多, 因此一般可以假定它是短时平稳的, 每一时刻我们都可以用这时刻附近的一短段 例如15ms 语音信号分析得到一种频谱。对语音信号连续地进行频谱分析就可以得到一种二维图谱, 其横坐标表示时间, 纵坐标表示频率, 而每像素的灰度值大小反映相应时刻和相应频率的信号能量密度。这种时频图称为语谱图 Sonogram 或Spectrogam , 这种反映语音信号动态频谱特性的时频图在语音分析中有重要实用价值, 被视为可视语言。从语谱图上不仅能看出任一时刻发音器官的共振峰特征,而且可以看出语音的基音频率, 是否清音、爆破音等。语谱分析在语音识别、合成及编码中很有意义。
1.1 语谱图的产生基理
语音信号是一种典型的非平稳信号, 但是其非平稳性是由发音器官的物理运动过程而产生的, 此过程与声波振动的速度相比较缓慢, 可以假定在10~30ms这样的短时间内是平稳的。傅立叶分析是分析线性系统和平稳信号稳态特性的强有力的手段, 而短时傅里叶分析, 也叫时间依赖傅立叶变换, 就是在短时平稳的假定下, 用稳态分析方法处理非平稳信号的一种方法。
设离散时域采样信号为x n , n 0,1,?,N- 1, 其中n 为时域采样点序号, N 是信号长度。然后对信号进行分帧处理, 则x n 表示为xn m , n 0,1,?,N- 1, 其中n 是帧序号, m 是帧同步的时间序号, N 为帧长 一帧内的采样点数 。信号 x n 短时傅里叶变换为:
其中 w n 为窗序列, 则信号x n 的离散时域傅里叶变换 DTFT 为:
采用离散傅里叶变换(DFT)得:
则P n,k 是二维的非负实值函数, 并且不难证明它是信号x n 的短时自相关函数的傅里叶变换。用时间n 作为横坐标, k 作纵坐标, 将P n,k 的值表示为灰度级所构成的二维图像就是语谱图。通过变换10log10 P n,k 能得到语谱图的dB 表示。
相关MATLAB 功能函数
2.1 用于短时频谱分析的功能函数
1 分帧加窗函数: 下面程序中采用的是hanning窗。根据要求还可选用hamming N ,blackman N 及bartlett N , 其中N 为窗长 帧长 。
2 快速傅里叶变换函数: fft s 。s 为加窗后的一帧信号。因为实时信号FFT 的频域样值关于中点 即采样频率的1/2 对称, 所以fft s 给出的矩阵数据只有前半部分有用。
3 复数取共扼函数: conj z 。
2.2 伪彩色映射和语谱图显示的功能函数
1 伪彩色映射函数: colormap MAP 。其中MAP 是所采用的伪彩色映射矩阵, 默认值为JET, 可以通过MAP colormap 获得当前的伪彩色映射矩阵, 它可以是一个任意行的矩阵, 但其必须有且只有三列, 并分别表示红色、绿色和蓝色的饱和度。
2 频谱图显示函数: imagesc t, f, L 。当数据比例映射使用整个色域时使用该函数, 其它情况下与image 函数作用相同。其中t 是时间坐标, f 是频率坐标,L 则是从功率谱值经伪彩色映射后的彩色电平值。
3 流程图及实现程序
3.1流程示意图:
3.2源程序:
function sogram Winsiz,Shift,Base,Mode,Gray
Winsiz 1024;
Shift 64;
Base 0;
Mode 1;
Gray 64;
[Sg,Fs] wavread E:\大家好.wav ;
n floor length Sg -Winsiz /Shift +1;
A zeros Winsiz/2+1,n ;
for i 1:n n1 i-1 *Shift+1; n2 n1+ Winsiz-1 ; Sg Sg :,1 ; s Sg n1:n2 ; s s.*hanning Winsiz ; z fft s ; z z 1: Winsiz/2 +1 ; z z.*conj z ; z 10*log10 z ; A :,i z;
end
L0 A Base ;
L1 A Base ;
B A.*L0+Base*L1;
L B-Base ./ max max B -Base ;
y [0:Winsiz/2]*Fs/Winsiz;
x [0:n-1]*Shift;
if Mode 1 colormap default ;
else mymode gray; mymode mymode Gray:-1:1,: ; colormap mymode ;
end
imagesc x,y,L
文档评论(0)