语音信号实验二.pdfVIP

  • 4
  • 0
  • 约2.37千字
  • 约 4页
  • 2024-12-10 发布于河南
  • 举报

语音信号实验二

端点检测

一、实验目的

1.掌握语音信号端点检测的短时能量分析效果与窗长的关系;

2.掌握语音信号端点检测的短时过零分析效果与窗长、零阈的关系;。

二、实验原理

1.短时能量分析

短时平均能量

n

22

E[x(m)w(nm)][x(m)w(nm)]

n

mmnN1

窗序列是沿着平方值的序列逐段移动,

窗口的长度对短时平均能量的影响

a.N很大,等效于带宽很窄的低通滤波器,

En随时间的变化很小,不能反映语音信号的幅

度变化,波形的变化细节就看不出来;

b.N太小时,滤波器的通带变宽,短时能量

随时间有急剧的变化,不能得到平滑的能量函

数。

窗口的长与短,是相对于语音信号的基音周期的。

在一个语音帧内,应含有l~7个基音周期。

基音周期变化范围很大,从女性儿童的2ms到老年男子的14ms(基音频率为500Hz~70Hz)。

在10kHz取样频率下,N折衷选择为100~200(10~20ms持续时间)。

短时过零分析过零就是信号通过零值。

过零数是样本改变符号的次数。

单位时间内的过零数称为平均过零数。语音信号x(n)的短时平均过零数定义浊音和清音语音的典型平均过零

Zsgn[x(m)]sgn[x(m1)]w(nm)

n

m

sgn[x(n)]sgn[x(n1)]*w(n)

a.发浊音时

声道有若干个共振峰,语音能量约集中于3kHz以下。

浊音时具有较低的平均过零数.

b.发清音时

多数能量出现在较高频率上。

清音时具有较高的平均过零数。

高低没有精确的数值关系。

c.过零分布浊音和清音的过零分布与高斯分布均很吻合。

浊音短时平均过零数的均值为14过零/10ms;

清音短时平均过零数的均值为49过零/10ms。

这两种分布有交叠区域,很难区分是清音还是浊音。

这种方法在区分特征时仍然是十分有用的。

平均窗选持续时间是15ms。3(1).短时平均过零数可用于清音和浊音的大分类上

高平均过零数对应于清音,

低平均过零数对应于浊音;

清音和浊音的变化非常明显。

(2).短时平均过零数用于判断寂静无语音和有语音的起点和终点位置。

a.在背景噪声较小时用平均能量识别较为有效,

b.在背景噪声较大时用平均过零数识别较为有效。

c.在以某些音为开头或结尾时,必须同时使用这两个参数。

三、实验要求

1.利用XP中的录音机程序(程序——附件——娱乐——录音机)以属性11025,16位,单声道,21KB/秒,

录制下面语音(以”.wav”文件格式存于\lab_1\data目录下)

“信息科学”

2.利用试验提供的语音信号处理实验一程序将语音分段,并以”.dat”文件格式存于

MATLAB\speech\lab_1\data目录下。

4.利用试验提供的语音信号处理实验二程序,对该段语音(.dat格式)进行短时能量分析、短时过零分析。

5.观察窗长、重叠对短时能量分析结果的影响,并粗略绘出窗长分别为57、112、222、450,重叠比率为15%

的短时能量分析结果图;

6.观察窗长、重叠、零阈比率对短时过零分析结果的影响。

四、程序使用

1.运行MATLAB

2.更改MATLAB的当前路径到MATLAB\speech\lab_2

文档评论(0)

1亿VIP精品文档

相关文档