- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 语音信号常见特征提取
第2章 语音信号常见特征提取;2.1 短时能量和平均幅度分析;决定短时能量特性有两个条件:不同的窗口的形状和长度。 ;海明窗:;N=51的直角窗和海明窗的对数幅频特性。海明窗的第一个零值频率位置比直角窗要大1倍左右,同时其带外衰减也比直角窗大得多。;这里窗长的选择对于反映语音信号的幅度变化起着决定的作用。如果很大,它等效于很窄的低通滤波器,此时随时间的变化很小,不能反映语音信号的幅度变化,信号的变化细节就看不出来;反之,窗长太小时,滤波器的通带变宽,随时间有急剧的变化,不能得到平滑的能量函数。 ;Example;;2、短时平均幅度分析;短时平均能量和短时平均幅度的主要用途: ;2.2 短时过零分析;语音信号短时过零分析;丹档猿傲唱迂讶丰被奥聂械灶喇捶效洋野者榜蒙琵嘉窝之额宜狈个花悟柜第2章 语音信号常见特征提取第2章 语音信号常见特征提取;短??门限过零率;短时过零分析的意义:;无声:S
清音:U
浊音:V;2.3 短时相关分析;自相关函数;自相关函数的性质;短时自相关函数:;如果定义:;短时自相关分析在语音识别中可有下面两个方面的应用:
用来区分清音和浊音,因为浊音信号是准周期性的,对浊音语音可以用自相关函数求出语音波形序列的基音周期;
另外在进行语音信号的线性预测分析时,也要用到短时自相关函数。;N=401时对8kHz取样的语音计算得到的图,计算滞后k大于0而小于250时的自相关值。前两种情况是对浊音语音段,第三种情况是对清音语音段。 ;修正的短时自相关函数:;矩形窗时:;修正的自相关函数;2.4 短时平均幅度差函数
;N=401时对8kHz取样的语音计算得到的图,计算滞后k大于0而小于250时的短时平均幅度差值。前两种情况是对浊音语音段,第三种情况是对清音语音段。 ;短时自相关函数和短时平均幅度差函数的关系:;2.5 短时傅里叶变换;令 ,则得离散的短时傅里叶变换 :
?
?
两个公式都有两种解释:①当n固定不变时,它们是序列w(n-m)x(m)的标准傅里叶变换或标准的离散傅里叶变换。此时 与标准傅里叶变换具有相同的性质,而 与标准的离散傅里叶变换具有相同的特性。②当w或k固定时, 和 看作是时间n的函数。它们是信号序列和窗口函数序列的卷积,此时窗口的作用相当于一个滤波器。 ;2. 标准傅里叶的解释;根据功率谱的定义,短时功率谱和短时傅里叶变换之间的关系为:;短时傅里叶变换为另一种形式: ;窗口序列的作用 ;可见,采样周期一定时, 随窗口宽度 的增加而减小,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。 ;N=500时海明窗与直角窗的浊音谱分析;N=50时海明窗与直角窗的浊音谱分析;短时傅里叶变换的滤波器解释:;曾竞菜九磐辊闺离衬笺袜搞赘蝇六广啸深气裔距遇载侈秋羊靛栏梯喉聘召第2章 语音信号常见特征提取第2章 语音信号常见特征提取;端点检测:
端点检测是指从包含语音的一段信号中确定出语音的开始和终止点。有效的端点检测不仅能使处理时间减到最小,而且能去除无声段的噪声干扰,从而使识别系统具有良好的识别性能。
一个较好的端点检测算法应该能够满足:
门限值可以对背景噪声的变化有一定的适应;
能够将短时冲激噪声和超过门限值的信号纳入无声段而不是有声段;
对于爆破音的寂静段,应将其纳入语音的范围而不是无声段;
应该尽量避免在检测中丢失鼻韵和弱摩擦音等与噪声特性相似、短时参数较少的语音;
;端点检测方法分类:
基于阀值的方法:
提取每一帧语音信号的声学特征,然后把这些特征的幅值与设定的阀值进行比较,从而对每一语音帧进行分类;
模式识别的方法:
需要估计语音和噪声信号的模型参数,检测过程和识别过程类似。
由于基于阀值的方法具有简单、快速的优点,从而被广泛研究和使用,但在噪声环境下该方法检测效果会变得很差。
基于模式识别的方法具有准确性好、稳健性较强的特点,但缺点是此类方法的复杂度高,运算量大,很难应用到实时语音编码系统中。;传统的端点检测算法;2、低频能量
基本原理:语音中的浊音信号具有能量集中在低频部分的特征,根据这一特点,改进短时能量阀值可以得到低频能量,判断浊音信号,效果较好。;低频能量的判别公式为:
;3.双门限前端检测法;3.基于噪声动态检测的语音端点检测算法;仿真实验及结果分析;4. 基于小波变换的语音端点检测算法;步骤:
1) 先将语音信号分成由1024个采样点组成的帧;
2) 对每帧进行10层小波分解;
3)
文档评论(0)