- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章语音信号的频域分析
国家“十一五”规划教材
《数字语音编码》讲议
同济大学电子与信息工程学院
赵晓群 编著
机械工业出版社,2007年
;第5章 语音信号的频域分析;第5章 语音信号的频域分析
5.1 概述
语音感知与语谱特性关系密切,人对语谱特性更敏感。
◆幅频谱特性相似的两段语音,感知相似。
◆语谱具有语言声学意义,反应了重要的语音特征;
如共振峰频率、带宽等。
进行语音频谱分析是认识和处理语音信号的重要方法。
Fourier 分析是有效手段,是语音的重要分析工具。
语音是非平稳信号,源于发声器官的物理运动过程。
◆在短时间段(如10 ~ 30 ms)内可认为是平稳的;
◆用时间依赖处理方法分析处理。;短时 Fourier 分析(时间依赖 Fourier 变换):
用稳态分析处理非平稳信号的一种方法
语音的频域分析:包括语音信号的频谱、功率谱、倒频谱、
频谱包络等,
常用频域分析方法:带通滤波器组法、Fourier 变换法、
同态分析、线性预测法等。
本章:带通滤波器组法、Fourier 变换法、频域基音检测、
时-频表示;第5章 语音信号的频域分析
5.2 基于滤波器组的频域分析
最早的频谱分析:滤波器组来实现。
特点:简单、实时性好、受外界影响小。
常用模拟滤波器实现,也可用数字滤波器实现。
◆宽带带通滤波器:平坦特性,可粗略求取语音频谱,分辨率较低,相当于短时处理时窄窗情况。
◆窄带带通滤波器:频率分辨率较高,
相当于短时处理时宽窗较宽的情况。
图5.1:滤波器组法频谱分析原理图。;第5章 语音信号的频域分析
5.3 短时 Fourier 变换(STFT)的定义和性质
5.3.1 STFT 的定义
语音序列是时变的。
分段方法:加一个沿时间轴滑动的窗函数;
◆通常窗的宽度有限;
◆对应于不同的 n 值,窗处于不同位置;
◆窗函数对语音信号的每个样本进行加权。
图5.2:移动窗函数选取语音段的示意图
◆图中使用的是非矩形窗,
时刻 n 位于窗的中心 ;x(m)的短时 Fourier 变换(STFT)Xn(ejω)的定义:
式中, w(n)是窗函数。
◆为位于 n 处的窗口观察到的窗选语音短段的 Fourier 变换;
◆ n 取不同值时,取出不同的语音短段;
◆ Xn(ejω) 是频率ω 和时间 n 的函数;有时-频性。
要求: STFT 存在,则对所有 n 值,一定绝对可和。
◆因窗宽有限,或无限冲激响应窗函数,其有效宽度有限,
故满足绝对可和。 ;根据 STFT,恢复原语音信号 x(m) 的方法:
式
的逆变换为:
若w(0)≠0,由上式得:
◆准确地恢复原信号的唯一约束条件是 w(0)≠0 。
;由STFT的谱 Xn(ejω) 求解 x(m) 的 Fourier 变换 X(ejω) 方法。
假设 x(m) 和 w(m) 的 Fourier 变换都存在,即:
◆因 Xn(ejω) 是 x(m)w(n-m) 的 Fourier 变换,
则 Xn(ejω) 是 X(ejω) 与 ejωnW(e-jω) 的卷积,即
为使 Xn(ejω) 准确代替 X(ejω),移动窗的 W(ejω) 应是冲激函数;即要求移动窗无限宽。;注意:由于语音是时变的,故其 Fourier 变换可能不存在。
通常,
◆窗函数是有限时宽,故窗选语音段可看成从无限长的基本性质延续不变的平稳信号中截取出来的;
◆对于爆破音等暂态音,则可看成在窗外取值为零。
若把X(ejω)看成是基本性质在窗外延续不变或窗外取值为零的某个平稳信号的 Fourier 变换,则式
就是有意义的。
观点:STFT 是平稳信号的 Fourier 变换经加窗平滑的结果。; 5.3.2 窗函数及窗宽对STFT的影响
图5.3a:元音 [i] 的波形和短时频谱图。
◆元音 [i] 的基音周期大约是 13 ms;
短时频谱图有两种变化:
◆快变化:周期性激励引起,
基音频率的各次谐波;
◆慢变化:声道共振特性引起,
各共振峰的频率和带宽。
两个频谱图间的差别:
◆矩形窗时:谐波各峰较尖锐,
谱图较破碎(类似于噪声),
主瓣较窄(较高频率分辨率);
旁瓣较高, “泄漏”严重;
◆Hamming 窗时:短时频谱平滑些。
短时谱分析,Ha
文档评论(0)