- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专业技术资料
专业技术资料
实验题
目
基于MATLAB的语音信
号时域特征分析
基于MATLAB分析语音
信号频域特征
小组合
作
否
姓名
班级
信息安全
学号
一、实验目的
本实验要求掌握时域特征分析原理 ,并利用已学知
识,编写程序求解语音信号短时过零率 、短时能量、短时自相
关特征,分析实验结果,并能掌握借助时域分析方法所求得的 参数分析语音信号的基音周期及共振峰 。
本实验要求掌握傅里叶分析原理,会利用已学的知 识,编写程序估计短时谱、倒谱,画出语谱图,并分析实验结 果,在此基础上,借助频域分析方法所求得的参数分析语音信 号的基音周期或共振峰。
二.实验环境
一台装 cool edit pro2.1 和 MATLAB 的计算机。
三、实验内容与步骤
实验原理:
1.窗口的选择
通过对发声机理的认识,语音信号可以认为是短时平稳的 。在5~50ms的范围内,语
音频谱特性和一些物理特性参数基本保持不变 。我们将每个短时的语音称为一个分析帧 。
般帧长取10~30ms。我们采用一个长度有限的窗函数来截取语音信号形成分析帧 。通常
会采用矩形窗和汉明窗。图1.1给出了这两种窗函数在帧长 N=50时的时域波形
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0
矩形窗20 4060sample图1.1 矩形窗和Hamming窗的时域波形
矩形窗
20 40
60
sample
w (n)1,0 nN0,
w (n)
1,0 nN
0,其他
窗函数定义为如下hamming 窗的定义 : 一个 N 点的hamming
窗函数定义为如下
0.54 0.46cos(2
w(n)= 0,其他
这两种窗函数都有低通特性 ,通过分析这两种窗的频率响应幅度特性可以发现 (如图 1.2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大
(-13.3dB),会导致泄漏现象;汉明窗的主瓣宽 8*pi/N,旁瓣峰值低(-42.7dB),可以 有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用汉明窗 ,在
计算短时能量和平均幅度时通常用矩形窗 。表1.1对比了这两种窗函数的主瓣宽度和旁瓣
峰值。
矩形窗频率响应归一化频率(f/fs) Hamming 窗频率 响应-1000-50■ ■*.I \t
矩形窗频率响应
归一化频率(f/fs) Hamming 窗频率 响应
-100
0
-50
■ ■*.
I \
t
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
归一化频率(f/fs)
图1.2 矩形窗和Hamming窗的频率响应
表1.1矩形窗和hamming窗的主瓣宽度和旁瓣峰值
窗函数
主瓣宽度
旁瓣峰值
矩形窗
4*pi/N
13.3dB
hammin
g
8*pi/N
42.7dB
2.短时能量
由于语音信号的能量随时间变化 ,清音和浊音之间的能量差别相当显著 。因此对
语音的短时能量进行分析 ,可以描述语音的这种特征变化情况 。定义短时能量为:
n
TOC \o 1-5 \h \z 2 2
En [x(m)w(n m)] [x(m)w (n m)]
m m n N 1 ,其中N为窗长
特殊地,当采用矩形窗时,可简化为:
En x2(m)
m
图1.3和图1.4给出了不同矩形窗和 hamming窗长的短时能量函数,我们发现:在用 短时能量反映语音信号的幅度变化时 ,不同的窗函数以及相应窗的长短均有影响 。
hamming 窗的效果比矩形窗略好 。但是,窗的长短影响起决定性作用 。窗过大(N很
大),等效于很窄的低通滤波器,不能反映幅度 En的变化;窗过小(N很小),短时能 量随时间急剧变化,不能得到平滑的能量函数 。在11.025kHz左右的采样频率下,N选为 100~200比较合适。
短时能量函数的应用:1)可用于区分清音段与浊音段 。En值大对应于浊音段,En值小 对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间 (根据En值的变化趋
势)。3)对高信噪比的语音信号 ,也可以用来区分有无语音 (语音信号的开始点或终止
点)。无信号(或仅有噪声能量)时,En值很小,有语音信号时,能量显著增大。
01 11 1 11 1 1 II 11 1 1 H 10) 2000 4000 6000 8000 10000 1200014000 16000 11sampl04]00 2000 4000 6000 8000 10000 1200014000 16000 18000sampl0
0
1 1
1 1 1
1 1 1 II 1
1 1 1 H 1
0
) 2000 4000 6000 8000 10000 1200014000 16000 1
文档评论(0)