网站大量收购独家精品文档,联系QQ:2885784924

语音信号的时域和频域特征.docx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第一章

语音信号的时域及频域特征

1.语音信号的主要特点

1.1.语音信号带宽

语音信号的带宽约为5KHz,主要能量集中在低频段。

1.2.语音信号是典型的随机信号

1)人的每次发音过程都是一个随机过程。很难得到两次完

全相同的发音样本。

2)在信号处理中,通常假设语音信号是短时平稳的。例如,可以认为在语音的浊音段部分,语音的二阶矩统计量是平稳的

(在5~10mS内),即二阶矩平稳,或称为宽平稳。

1

2.语音信号的时域波形

语音信号的波形(shi4)

2

语音信号波形(shi4)的局部细节

3

2.1.语音时域信号特征

2.1.1.语音时域信号的特点

1)清音段:能量低,过零率高,波形特点有点像随机的噪

声。这部分信号常与语音的辅音段对应。

2)浊音段:能量高,过零率低,波形具有周期性特点。所

谓的短时平稳性质就是处于这个语音浊音(元音)段中。

3)过渡段:一般是指从辅音段向元音段信号变化之间的部

分。信号变化快,是语音信号处理中最复杂、困难的部分。

4

2.1.2.语音的短时能量、短时平均幅度和短时过零率

(1)短时能量:

(2)短时平均幅度:

(3)短时过零率:

其中

5

3.语音信号的短时谱特征

3.1.短时傅立叶谱分析

对于能量受限的时域信号f(t),它的傅立叶变换可以写成

以上这个傅立叶变换,在“宏观上”给出信号f(t)的频谱信息,但是却无法确定某个“局部”时间段频谱的确切信息。或者也可以说,我们不能通过观测局部的时域信号来了解整个f(t)的

频谱信息。为此我们引入了所谓的短时傅立叶谱分析技术。

6

有许多技术都可以用来完成信号的短时谱分析。最典型的

就是小波变换和我们现在常采用FFT短时谱分析技术。

傅立叶短时谱分析与窗的形状和位置有关(与时刻有关)。

假设窗函数为w(t),那么信号f(t)的短时傅立叶变换为

例如,如果选择窗的形式为一个高斯函数

7

由于

所以有

这说明可以被加窗后的短时谱

这正是我们所希望的性质。

所精确地分解。

8

对于时域离散信号x(n),短时傅立叶变换定义:

这里w(n)为窗函数。例如,常用的窗函数有

矩形窗:

汉明窗:

9

3.1.1.短时傅立叶变换的线性滤波实现形式

短时傅立叶变换可以用两种滤波器实现形式来解释。

实现形式一:

对信号x(n)进行调制,将频谱搬移到低端,然后用w(n)滤

波器进行滤波分析。

10

X,(e

X,(e

x(n)

w(n)

w(n)

e~iom

11

实现形式二:对具有低通性质的w(n)滤波器进行调制,得到

带通滤波器,用此带通滤波器对信号x(n)进行分析。

e,-jon

12

rHaFREOUENCY

rHa

FREOUENCY

3.2.语谱图:

横轴表示时间,纵轴表示频率,用灰度表示对应频谱分量

的信号强度。

S0o

Akaea

4000

2000

1000

u

4000

200,

1009:

益00》04006300Q204.0004Bh00A

TIME.(aed)

4000

E

M

3

Spetogpumeofthevowelwmnd

l120

3.3.浊音谱特征

3.3.1.浊音谱的谱线结构

谱线结构是与浊音信号中的周期信号密切相关的。具有与

基音及其谐波相对应的谱线。

3.3.2.浊音谱的共振峰结构

频谱包络中有几个凸起点,与声道的谐振频率相对应。这些凸起点称为共振峰(Formant)。其频率称为共振峰频率。按频率由低到高依次为第一共振峰、第二共振峰…。相应频率用

F1、F2、F3.….来表示。

14

tms*HDTP*A1mRttn4tt

N~r

mTeRt

浊音信号的傅立叶分析谱

15

3.3.3.元音三角形图

所谓的元音三角形图就是指不同元音的F1、F2共振峰频

率在平面图上的关系。

元音三危形

16

3.4.清音谱特征

清音的频谱无明显的规律,比较平坦。在语音识别中使用

统计模型的方法加以解决。

17

4.基音与四声

4.1.基音周期与基音频率

1)基音的周期就是声带振动的周期。基音周期的倒数就是

基音频率。

2)基音是与人的声带长度、质量等物理量有关。因此与人

的年龄、性别、情绪等生理状态有关。

[注意]:音高(Pitch)与基音的关系。音高是听觉量,基音是物理

量。正如冷热与温度的关系一样。

18

基音周期示意图

19

4.2.基音的检测

4.2.1.时域上的基音检测方法

(1)AMDF法:

定义平均幅度差函数

在这里

文档评论(0)

zhanghaoyu888 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档