- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 语音信号的特征分析;3.1 语音信号的数字化;语音信号的采样频率;量化精度;语音分析是语音信号处理的前提和基础;
分析的目的是提取需要的信息,获取特征表示参数;
短时分析
语音是一个时变信号
语音的短时平稳特性,在10~30ms时间段内相对平稳
;预滤波;帧和加窗的概念;;为了减小语音帧的截断效应,需要加窗处理;;几种常见的窗函数的波形
Matlab中,可以通过help window命令来查看怎么产生不同的窗;几种不同的窗函数波形与频谱的比较;不同的窗选择,将决定短时语音分析结果的好坏
首先是窗的长度,无论什么形状的窗,长度N将起决定性的作用。
N选得太大,不能保证每一帧的语音的平稳特性
N太小,不能保证信号的统计特性,容易产生统计噪声
对于频域分析而言,窗长N还直接决定了信号频谱的分辨率
对于语音信号,通常帧长应选择为一个语音帧包含有至少2个基音周期为好。人的语音的基音周期值是变化的,从女性小孩的2ms到老年男子的14ms(即基音频率为500Hz至70Hz),所以N的选择是比较困难的。通常折衷的选择N为20~30ms。若采用频率为10KHz,则相当于每帧的长度(即窗口序列的长度)约为200~300点为宜。若采样频率为8KHz,相当于160~240点
其次是窗口的形状,不同的窗,其频率特性是不一样的,这在短时频域分析时尤为重要。
;窗函数频谱的主瓣与旁瓣
主瓣:
主瓣宽度控制频谱分析的频率分辨率,主瓣越窄,频率分辨率越高
矩形窗的主瓣宽度 = fs/N
hamming窗的主瓣宽度 约为 2fs/N
旁瓣:
旁瓣的高度决定了对临近频率成分的干扰抑制能力,高度越低,抑制干扰能力越强
矩形窗: 主瓣高度 - 第一个旁瓣高度 ≈ 13dB
hamming窗: 主瓣高度 - 第一个旁瓣高度 40dB
旁瓣高度跟窗长N 无关;窗函数及其比较;
短时能量
短时平均幅度
短时过零率
短时自相关函数
短时平均幅度差函数;语音信号的短时能量(语音信号强度的度量参数);语音信号及其取不同窗长时的短时能量;短时平均能量的主要用途;语音信号的短时平均幅度;;语音信号的短时过零率;短时过零率
波形穿过横轴(零电平)的次数;;短时过零率在语音信号分析中的应用; 直方图的分布形状与高斯分布很吻合,而且浊音时的短时平均过零率的均值为14过零/10ms,清音时短时过零率的均值为47过零/10ms。注意到浊音和清音有一个交叠区域,此时很难分清是浊音还是清音,尽管如此,平均过零率仍可以粗略的判断清音和浊音。;作为短时过零率的一个改进参数,语音分析时更常用的是短时过电平率(level-crossing rate)。
短时过电平率在区分清音和静音时很有用;短时过零率;清(U)、浊(V)、无声(S)的平均幅度(M)和过零率(Z)
的条件概率密度函数;浊音、清音、无声的短时特性;语音有声和无声;判断语音信号的起点和终点的一种算法;根据MH可判定输入语音中的前后两个点 和 , 它们之间肯定是语音段,但是语音的精确起点、终点还要在 之前和 之后仔细查找。为此在设置一个低阈值参数ML ,由 向前找,当短时平均幅度M由大到小减至ML时可以确定点N1 。类似由 向后找,可以确定N2 。在N1和N2之间仍能肯定是语音段。
;由N1向前和N2向后继续用短时过零率Z进行搜索。根据无声情况下短时过零率Z的均值,设置一个参数Z0,如果由N1向前搜索时Z始终大于Z0的3倍,则认为这些信号仍属于语音段,直至Z突然下降到低于3Z0值时,这时可以确定语音的精确起点。对终点做同样的处理。采取这一算法的原因在于, N1以前可能是一段清辅音段(如f,s),它的能量相当弱,依靠能量不可能把他们与无声段区别开,而他们的过零率明显高于无声,因而能用这个参数来精确的判断二者的分割点,也就是语音真正的起点。;判断语音信号的起点和终点的其它算法;自相关函数(auto-correlation function);语音信号的短时自相关函数;浊音和清音的自相关函数图; X √ X X X;为了减少这种错误,可以先将语音信号进
行中心削波处理,再求自相关函数;中心削波处理前后的语音信号及其自相关函数;短时自相关函数的特点;基于短时自相关函数的基音周期估计方法;语音信号的短时平均幅度差函数(AMDF);浊音及其对应的AMDF图;;短时基音周期估计;基音估计的其他方法:
倒谱法(CEP)
简化的逆滤波器法(SIFT)
小波变换的方法
……;3.4 语音信号的频域特征分析;短时频域分析中,窗函数的选择对语音的频谱有很大的影响
根据卷积定理:;几种常见的窗函数的波形
Matlab中,可以通过help
您可能关注的文档
最近下载
- 2025年新能源发电行业分析报告及未来五到十年行业发展趋势报告.docx
- 未成年人出游免责协议书5篇.docx VIP
- 八年级体育教育教学计划..doc VIP
- 劳动教育(微课版):认识劳动PPT教学课件.pptx VIP
- 特高压输电系统温室气体减排方法学.PDF VIP
- (高清版)DGJ 08-2173-2016 展览建筑及布展设计防火规程.pdf VIP
- 高中英语【拓展阅读】Before You Feel Pressure 双语课件.pptx VIP
- 2025年新人教版数学三年级上册全册教案.pdf
- 社会心理学:文化心理学完整版.pptx VIP
- 卫生部手术分级目录(2025年1月份修订).doc VIP
文档评论(0)