语音信号处理 第4版 课件 第4章:语音信号分析.pptx

语音信号处理 第4版 课件 第4章:语音信号分析.pptx

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

南京邮电大学通信与信息工程学院第4章语音信号分析

4.0概述短时分析技术虽然语音信号具有时变特性,但在一个短时间范围内(10~30ms),其特性基本保持不变,即相对稳定(由于口腔肌肉运动相对缓慢)——短时平稳性。短时分析:将语音分为一段一段来分析其特征参数,其中每一段称为一帧(10~30ms)。对于整体语音而言,分析处的是由每一帧特征参数所组成的特征参数时间序列。分析方法(根据分析出的参数性质不同):时域分析、频域分析、倒谱域分析、线性预测分析。

语音分帧语音信号的时域分析语音信号的频域分析语音信号的倒谱分析语音信号的线性预测分析

4.1语音分帧帧移与帧长的比值一般取0~1/2;分帧的实现:用可移动的有限长度窗口进行加权:

4.1语音分帧矩形窗的谱平滑特性好,但由于主瓣宽度小,加窗后的语音损失了高频成分;汉明窗正好相反。窗的选择(1)窗函数的选择标准:在时域需要减小时间窗两端的坡度,使截取得到的语音波形缓慢降为0,减小语音帧的截断效应;在频域要有较宽的3dB带宽以及较小的边带最大值。(2)窗口长度的选择:N与时间分辨率、频率分辨率之间的关系(N越大,频域带宽越小,语音信号加窗后反应波形细节的高频部分被阻碍,短时能量随时间变化小,不能真实反应语音幅度变;反之亦然);N的数值:保证在一个语音帧里包含1~7个基音周期。

语音分帧语音信号的时域分析语音信号的频域分析语音信号的倒谱分析语音信号的线性预测分析

4.2语音信号的时域分析时域分析的特点(1)语音信号直观表示、物理意义明确;(2)实现简单、运算量小;(3)可以得到语音的一些重要参数;(4)只使用示波器等通用设备,使用简单。典型的时域分析(1)短时能量和短时平均幅度分析(2)短时过零率分析(3)短时相关分析

4.2语音信号的时域分析—短时能量短时能量、短时平均幅度对高电平敏感!用途:(1)区分浊音段和清音段;(2)区分声母和韵母的分界、无声与有声的分界等。

4.2语音信号的时域分析—短时过零率短时过零率:一帧语音中信号波形横穿零电平的次数符号函数对于浊音,其语音能量集中在3kHz以下低频段,过零率也低;清音多数能量出现在较高频率上,过零率相对较高。用途:从背景噪声中找出语音信号,用于判断寂静无声段和有声段的起点和终点位置。背景噪声较小时用平均能量较为有效,而背景噪声较大时用平均过零率更有效。

4.2语音信号的时域分析—短时过零率无声(S),清音(U),浊音(V)的短时平均幅度以及短时过零率的概率分布浊音:短时平均幅度最高,短时过零率最低;清音:短时平均幅度居中,短时过零率最高;无声:短时平均幅度最低,短时过零率居中。可基于概率论,通过短时平均幅度和短时过零率,来判别语音中的浊音/清音/无声类别。

4.2语音信号的时域分析—短时相关分析短时相关分析:用于求浊音语音的基音周期,用于线性预测分析短时自相关函数:K为最大延迟点数性质:(1)如果是周期的(周期为Np),则自相关函数是同周期的周期函数,(2)是偶函数,即,(3)当k=0时,自相关函数具有最大值,即,,并且等于确定性信号序列的能量或随机序列的平均功率。

4.2语音信号的时域分析—短时相关分析修正的短时相关分析:传统短时自相关函数的缺点:(1)随着延迟k的增加,进行乘积和的项数在减少,导致自相关函数的幅度值随着k的增加而下降;(2)如果窗长不够,包含的周期数不够多,会给周期计算带来麻烦。

4.2语音信号的时域分析—短时相关分析修正的短时相关分析:用两个长度不同的窗口,截取两个不等长的序列进行乘积和,两个窗口长度始终相差最大的延迟点数K。这样可以始终保持乘积和的项数不变,始终为短窗的长度。

4.2语音信号的时域分析—短时相关分析短时幅度差函数:计算自相关函数的运算量很大(有乘法运算)。如果信号是完全的周期信号,则相距为周期的整数倍的样点上的幅值是相等的,差值为0(实际语音信号差值很小,极小值出现在整数倍周期的位置上)定义:浊音(a)(b)和清音(c)的短时平均幅度差函数

语音分帧语音信号的时域分析语音信号的频域分析语音信号的倒谱分析语音信号的线性预测分析

4.3语音信号的频域分析利用短时傅里叶变换求语音短时谱第n帧语音信号的离散傅里叶变换:窗类型的选择以及窗口宽度的选择(与时域分析结论相同!)

4.3语音信号的频域分析利用短时傅里叶变换求语音短时谱令角频率,则得到离散短时傅里叶变换:在语音信号的数字处理中都是采用上式来作为频谱,可以采用FFT完成将时域语音变换到频域。语音的功

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档