8语音信号处理.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
8语音信号处理

*/81 三、窗宽对 的影响 窗宽为64点(10kHz)元音[a]的短时频谱图 短窗的频率分辨率下降,频谱图中丢失了关于语音基音周期的信息,只保留慢变化。 矩形窗 汉明窗 8.5 短时傅里叶变换 */81 8.5 短时傅里叶变换 四、STFT的线性滤波实现 第1种: */81 8.5 短时傅里叶变换 第2种: */81 8.5 短时傅里叶变换 语音的时域分析和频域分析是语音分析的两种重要的方法,但是这两种方法均有局限性: 时域分析对语音信号的频率特性没有直观的了解; 频域特性中又没有语音信号随时间的变化关系。 因此人们致力于研究将时域分析和频域相结合,综合了频谱图和时域波形的优点,明显得展示了语音频谱随时间的变化情况。 五、语谱图 */81 8.5 短时傅里叶变换 */81 8.5 短时傅里叶变换 语谱图结构: 横轴为时间; 纵轴为频率; 强度用灰度来表示,指示特定频带的能量大小,即声音的强弱。 根据滤波器的带宽可将语谱图分为两类。带宽为300 Hz的宽带语谱图可以显示细致的时间结构,但谐波结构就不太清楚。对于一个有声带振动的声音来说,语谱图上有垂直的条纹,每一个条纹代表了声门的一次开放。而宽的横带则为共振峰。带宽为45 Hz的窄带语谱图使时间的结构模糊,但是频率的信息则较好。在较宽的共振峰带中可以看到各别的谐波频率。 */81 8.5 短时傅里叶变换 时域波形与语谱图 */81 8.5 短时傅里叶变换 共振峰与语谱图 在频域上,能量集中处就是共振峰之所在,在语谱图上就是颜色较深的位置。 在发元音时,音强较大,声带振动而呈现出基频及其谐振频率,也可以明显看到共振峰,能量集中在低频。 如果是发辅音,而且声带不振动,就看不到谐振频率。通常辅音的音强小,颜色看来就比较淡,而且能量较集中在高频。 若是在没有语音的空档,则语谱图上呈现的,就是有一段空白。 */81 使用相关函数 1. 使用tfrstft函数实现STFT 由于一般情况下MATLAB未提供该函数,需要自行安装。 下载最新的时频分析工具箱,假设为tftb; 将tftb复制到MATLAB安装目录下的toolbox目录下面 使用下列语句将该工具箱的路径添加到搜索路径下: addpath(genpath(C:\Program Files\MATLAB\R2009a\toolbox\tftb)) 在命令窗口中输入下面的命令: which tfrstft 若显示路径正确,则表示安装成功。 */81 使用相关函数 函数: [TFR,T,F]=TFRSTFT(X,T,N,H,TRACE) X:待分析信号. T:时间? ?? ? (默认值: 1:length(X)); N:频率点数 (默认值: length(X)); H:选择的平滑窗函数? ? (默认值: Hamming(N/4)); TRACE:如果不为零,跟踪计算过程? ?(default : 0); TFR:得到的时频谱值(复数); F:归一化频率。 */81 使用相关函数 2. 使用specgram函数: [b,f,t]=specgram(data,nfft,Fs,window,numoverlap); 目前,该函数已被spectrogram函数取代。 */81 使用相关函数 3. spectrogram函数 S?=?spectrogram(x) S?=?spectrogram(x,window) S?=?spectrogram(x,window,noverlap) S?=?spectrogram(x,window,noverlap,nfft) S?=?spectrogram(x,window,noverlap,nfft,fs) [S,F,T]?=?spectrogram(x,window,noverlap,F) [S,F,T]?=?spectrogram(x,window,noverlap,F,fs) x:输入信号的向量。若无后续输入参数,x将被分成8段分别做变换处理。如果x不能被平分成8段,则会做截断处理; window:默认为Hamming窗; */81 使用相关函数 noverlap:各段之间重叠的采样点数。默认存在50%的重叠; nfft:计算离散傅里叶变换的点数。默认为256和大于每段长度的最小2次幂之间的最大值。 fs:采样频率Hz,默认为1Hz。 S:输入信号x的短时傅里叶变换。 F: 在输入变量中使用F频率向量,函数会使用Goertzel方法计算在F指定的频率处计算频谱图。指定的频率被四舍五入到与信号分辨率相关的最近的DFT容器(bin)中。而在其他的使用nfft语法中,短时傅里叶变换方法将被使用。 对于返回值中的F向量,为四舍五入的频率,其长度等于S的行数;

文档评论(0)

little28 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档