网站大量收购独家精品文档,联系QQ:2885784924

【语音处理】4个基本的时域信号特征分析技术 .pdfVIP

【语音处理】4个基本的时域信号特征分析技术 .pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

【语音处理】4个基本的时域信号特征分析技术

上一节主要介绍了关于加窗函数的相关内容。对语音的时域信号

进行分析是最直观的分析方式。本文将介绍语音信号处理中四种时域

特征,分别是短时能量、短时过零率、短时自相关函数以及短时平均

幅度差。

作者编辑|小米粥

编辑|言有三

1.短时能量

由于语音信号具有短时平稳性,我们通常对语音进行分帧处理。

首先定义矩形窗为w(m),那么对于语音信号x(t),其加窗分帧后第n

帧语音信号xn(m)为

矩形窗的是最直观、简单的窗函数,我们以其为例进行说明。矩

形窗的表达式为:

在该计算式中,n=0,T,2T,...,N为帧长,T为帧移长度。

第n帧语音信号xn(m)的短时能量En为

使用幅值平方将对高幅值信号具有较大的敏感度,为了降低敏感

度,定义短时平均幅度函数Mn为

短时能量En和短时平均幅度函数Mn的主要用途:

1.浊音相比较于清音的En具有较大的数值,因而可用于区分浊音

和清音。

2.利用短时能量区分有声段和无声段,也可对声母和韵母分界,

对无间隙的连字分界。

3.在语音识别任务中作为特征,表示能量特征和超音频信息。

2.短时过零率

短时过零率表示一帧语音中波形信号穿过零值的次数。对于连续

信号,过零意味着波形通过时间轴,而对于离散信号,过零意味着相

邻采样点的符号改变。

首先定义符号函数sgn[·]为

则第n帧语音信号xn(m)的短时过零率Zn为

由于短时过零率容易受到低频干扰,可设置相关门限T,将过零修

改为穿过正负门限的次数,即

门限的存在使得短时过零率Zn具有一定的扛干扰能力,避免随机

噪声导致的虚假过零。

短时过零率的主要用途:

1.浊音能量集中于3kHz内的低频率段,清音能量集中于高频率段,

而短时过零率可以一定程度反映频率高低,因而浊音段相对于清音段,

其短时过零率减低。

2.将短时过零率和短时能量结合实现端点检查。短时能量适用于

背景噪声较小的情况,而短时过零率适用于背景噪声较大的情况。实

际中,通常结合两个参数实现语音起点和终点的判断。

3.短时自相关函数

语音信号xn(m)的短时自相关函数Rn(k)为:

其中,若信号xn(m)具有周期性,则短时自相关函数Rn(k)也具有

周期性,且两者周期相同;Rn(k)为偶函数,当k=0s时,自相关函数

具有最大值。

假设语音信号xn(m)的周期为T,那么短时自相关函数Rn(k)将在

k=T,2T...取值时出现峰值。若要出现第一个峰值(即k=T),根据计算

需要取到信号中x(m=2T的样本点,即语音帧宽至少应大于两个

周期,否则第一个峰值将无法较好的显示。例语音最小基频为80Hz,

最大周期为12.5ms,两倍周期为25ms,因此10kHz的采样信号的帧

宽至少为250个采样点。

另一方面,考虑到语音信号的短时性,应设置较低的帧长,因此

可使用修正短时自相关函数,其定义为

其中,有

相比于短时自相关函数Rn(k),在修正短时自相关函数中,第一项

xn(m)与Rn(k)中的xn(m)相同,而第二项xn(m)与Rn(k)中的xn(m)

相比,差异在于额外向后包括了k个样本点。

在严格定义中,修正短时自相关函数是一个互相关函数,其不满

足自相关函数的性质(偶函数性),但其仍在周期整数倍上具有峰值。

短时自相关函数的用途:

1.浊音的自相关函数具有周期性,而清音的自相关函数类似于高

频白噪声,没有周期性。

2.根据自相关函数的第一个峰值的位置,估算浊音的基音频率。

4.短时平均幅度差函数

短时自相关函数使用大量乘法运算,计算时间较长,短时平均幅

度差Fn(k)使用减法代替了乘法,大大减少了运算量,大量运用于实时

语音处理方案上,其定义为

对于周期为T的语音信号,短时平均幅度差Fn(k)在k=T,2T...等取

值上具有周期性的极小值。类似的,修正短时平均幅度差为

短时平均幅度差Fn(k)和R

文档评论(0)

177****8605 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档