第三章 语音信号的特征分析课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 语音信号的特征分析;3.1 语音信号的数字化;语音信号的采样频率;量化精度;语音分析是语音信号处理的前提和基础; 分析的目的是提取需要的信息,获取特征表示参数; 短时分析 语音是一个时变信号 语音的短时平稳特性,在10~30ms时间段内相对平稳 ;预滤波;帧和加窗的概念;;为了减小语音帧的截断效应,需要加窗处理;;几种常见的窗函数的波形 Matlab中,可以通过help window命令来查看怎么产生不同的窗;几种不同的窗函数波形与频谱的比较;不同的窗选择,将决定短时语音分析结果的好坏 首先是窗的长度,无论什么形状的窗,长度N将起决定性的作用。 N选得太大,不能保证每一帧的语音的平稳特性 N太小,不能保证信号的统计特性,容易产生统计噪声 对于频域分析而言,窗长N还直接决定了信号频谱的分辨率 对于语音信号,通常帧长应选择为一个语音帧包含有至少2个基音周期为好。人的语音的基音周期值是变化的,从女性小孩的2ms到老年男子的14ms(即基音频率为500Hz至70Hz),所以N的选择是比较困难的。通常折衷的选择N为20~30ms。若采用频率为10KHz,则相当于每帧的长度(即窗口序列的长度)约为200~300点为宜。若采样频率为8KHz,相当于160~240点 其次是窗口的形状,不同的窗,其频率特性是不一样的,这在短时频域分析时尤为重要。 ;窗函数频谱的主瓣与旁瓣 主瓣: 主瓣宽度控制频谱分析的频率分辨率,主瓣越窄,频率分辨率越高 矩形窗的主瓣宽度 = fs/N hamming窗的主瓣宽度 约为 2fs/N 旁瓣: 旁瓣的高度决定了对临近频率成分的干扰抑制能力,高度越低,抑制干扰能力越强 矩形窗: 主瓣高度 - 第一个旁瓣高度 ≈ 13dB hamming窗: 主瓣高度 - 第一个旁瓣高度 40dB 旁瓣高度跟窗长N 无关;窗函数及其比较; 短时能量 短时平均幅度 短时过零率 短时自相关函数 短时平均幅度差函数;语音信号的短时能量(语音信号强度的度量参数);语音信号及其取不同窗长时的短时能量;短时平均能量的主要用途;语音信号的短时平均幅度;;语音信号的短时过零率;短时过零率 波形穿过横轴(零电平)的次数;;短时过零率在语音信号分析中的应用; 直方图的分布形状与高斯分布很吻合,而且浊音时的短时平均过零率的均值为14过零/10ms,清音时短时过零率的均值为47过零/10ms。注意到浊音和清音有一个交叠区域,此时很难分清是浊音还是清音,尽管如此,平均过零率仍可以粗略的判断清音和浊音。;作为短时过零率的一个改进参数,语音分析时更常用的是短时过电平率(level-crossing rate)。 短时过电平率在区分清音和静音时很有用;短时过零率;清(U)、浊(V)、无声(S)的平均幅度(M)和过零率(Z) 的条件概率密度函数;浊音、清音、无声的短时特性;语音有声和无声;判断语音信号的起点和终点的一种算法;根据MH可判定输入语音中的前后两个点 和 , 它们之间肯定是语音段,但是语音的精确起点、终点还要在 之前和 之后仔细查找。为此在设置一个低阈值参数ML ,由 向前找,当短时平均幅度M由大到小减至ML时可以确定点N1 。类似由 向后找,可以确定N2 。在N1和N2之间仍能肯定是语音段。 ;由N1向前和N2向后继续用短时过零率Z进行搜索。根据无声情况下短时过零率Z的均值,设置一个参数Z0,如果由N1向前搜索时Z始终大于Z0的3倍,则认为这些信号仍属于语音段,直至Z突然下降到低于3Z0值时,这时可以确定语音的精确起点。对终点做同样的处理。采取这一算法的原因在于, N1以前可能是一段清辅音段(如f,s),它的能量相当弱,依靠能量不可能把他们与无声段区别开,而他们的过零率明显高于无声,因而能用这个参数来精确的判断二者的分割点,也就是语音真正的起点。;判断语音信号的起点和终点的其它算法;自相关函数(auto-correlation function);语音信号的短时自相关函数;浊音和清音的自相关函数图; X √ X X X;为了减少这种错误,可以先将语音信号进 行中心削波处理,再求自相关函数;中心削波处理前后的语音信号及其自相关函数;短时自相关函数的特点;基于短时自相关函数的基音周期估计方法;语音信号的短时平均幅度差函数(AMDF);浊音及其对应的AMDF图;;短时基音周期估计;基音估计的其他方法: 倒谱法(CEP) 简化的逆滤波器法(SIFT) 小波变换的方法 ……;3.4 语音信号的频域特征分析;短时频域分析中,窗函数的选择对语音的频谱有很大的影响 根据卷积定理:;几种常见的窗函数的波形 Matlab中,可以通过help

文档评论(0)

lifang365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档