第4章 语音识别特征(幻灯讲义).pdf

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章 语音识别特征(幻灯讲义)

第四章 语音识别特征 1. 语音信号的主要特点 1.1. 语音信号带宽 语音信号的带宽约为 5KHz ,主要能量集中在低频段。 1.2. 语音信号是典型的随机信号 1)人的每次发音过程都是一个随机过程。很难得到两次完 全相同的发音样本。 2 )在信号处理中,通常假设语音信号是短时平稳的。例如, 可以认为在语音的浊音段部分,语音的二阶矩统计量是平稳的 (在 5~10mS 内) ,即二阶矩平稳,或称为宽平稳。 1 2. 语音信号的时域波形 图4-1. 语音信号的波形(shi4 ) 2 图4-2. 语音信号波形(shi4 )的局部细节 3 2.1. 语音时域信号特征 2.1.1. 语音时域信号的特点 1)清音段:能量低,过零率高,波形特点有点像随机的噪 声。这部分信号常与语音的辅音段对应。 2 )浊音段:能量高,过零率低,波形具有周期性特点。所 谓的短时平稳性质就是处于这个语音浊音(元音)段中。 3 )过渡段:一般是指从辅音段向元音段信号变化之间的部 分。信号变化快,是语音信号处理中最复杂、困难的部分。 4 2.1.2. 语音的短时能量、短时平均幅度和短时过零率 N −1 (1)短时能量: E S n(2 ) ∑ w n 0 N −1 (2 )短时平均幅度: M S n( ) ∑ w n 0 (3 )短时过零率: N −1 ⎫ ⎧ 1 − ( 1)]n − sgn[ZS (n)] sgn[S ⎬ 2 ⎨∑ w w n 0 ⎭ ⎩ 1 ⎧0 x ≥ 其中 sgn[ ] n ⎨ −1 ⎩0 x 5 3. 语音信号的短时谱特征 3.1. 短时傅立叶谱分析 对于能量受限的时域信号 ,它的傅立叶变换可以写成 f t( ) ∞ j −t ω ˆ f ( ) f t( )ω ∫ ⋅e −∞ 以上这个傅立叶变换,在“宏观上”给出信号 的频谱信息,

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档