- 1、本文档共70页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.1概述
3.2语音信号的数字化和预处理
3.3语音信号的时域分析
3.4语音信号的频域分析
3.5语音信号的倒谱分析
3.6语音信号的线性预测分析
*3.7 语音信号的小波分析
3.8 基音周期估计
3.9共振峰估计
3.5语音信号的倒谱分析
3.6语音信号的线性预测分析
回顾
语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。这种分析方法的特点是:
①表示语音信号比较直观、物理意义明确。
②实现起来比较简单、运算量少。
③可以得到语音的一些重要的参数。
④只使用示波器等通用设备,使用较为简单等。
短时能量
过零率
短时平均幅度差
短时能量及短时平均幅度分析
如图3-2所示,设语音波形时域信号为x(t)、加窗分帧处理后得到的第n帧语音信号为xn(m),则xn(m)满足下式:
xn(m)=ω(m)x(n+m)
其中,n=0,1T,2T,…,并且N为帧长,T为帧移长度。
设第n帧语音信号xn(m)的短时能量用En表示,则其计算公式如下:
短时过零率分析
由定义可以看出,短时过零率对噪音的存在非常敏感,如果背景中有反复穿越坐标轴的随机噪声,那么会产生大量的“虚假”的过零,影响计算结果。
门限过零率
为了提高过零率计算的鲁棒性(Robustness),除了对原始信号进行带通滤波,一种有效的方法是修正过零率的定义,加入门限的定义.如图所示。
6.门限过零率
设一个门限值T,将过零的定义修正为穿越正负门限,带门限的过零率计算公式为
这样.噪音信号的振荡只要不超过门限间的区域,就不会对真实的过零率产生影响。
一般说来,短时过零率的最主要用处是分辨清音和浊音、有声与无声。
7.端点检测
背景噪音
辅音
元音
如何区分?能量?过零率?
语音“三”的波形图
背景噪音
辅音
7.端点检测
如何区分?能量?过零率?
短时平均幅度差函数
对于实际的语音信号,d(n)虽不为零,但其值很小。这些极小值将出现在整数倍周期的位置上。为此,可定义短时平均幅度差函数:
可以证明平均幅度差函数和自相关函数有密切的关系,两者之间的关系可由下式表达:
3.4 语音信号的频域分析
从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,常用的频域分析方法有
带通滤波器组法
傅里叶变换法
线性预测法
……
本节介绍傅里叶分析法。因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。
利用语音的短时傅里叶变换求语音的短时谱
对第n帧语音信号xn(m)进行傅里叶变换(离散时域傅里叶变换,DTFT),可得到短时傅里叶变换,其定义如下:
由定义可知,短时傅里叶变换实际就是窗选语音信号的标准傅里叶变换。这里,窗ω(n)是一个“滑动的”窗口,它随n的变化而沿着序列x(m)滑动。由于窗口是有限长度的,满足绝对可和条件,所以这个变换是存在的。当然窗口函数不同,傅里叶变换的结果也将不同。
我们还可以将式(3-27)写成另一种形式。设语音信号序列和窗口序列的标准傅里叶变换均存在。当n取固定值时,ω(n-m)的傅里叶变换为:
根据卷积定理有:
因为上式右边两个卷积项均为关于角频率ω的以2π为周期的连续函数,所以也可将其写成以下的卷积积分形式:
即,假设x(m)的DTFT是X(ejω),且ω(m)的DTFT是X(ejω),那么Xn(ejω)是X(ejω)和W(ejω)的周期卷积。
功率谱:根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之间的关系:
或者:
功率谱Sn(ejω)是短时自相关函数Rn(k)的傅里叶变换。
3.5 语音信号的倒谱分析
语音信号的倒谱分析就是求取语音倒谱特征参数的过程,它可以通过同态处理来实现。
同态信号处理也称为同态滤波,它实现了将卷积关系变换为求和关系的分离处理,即解卷。
对语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语音编码、合成、识别等。
求倒谱特征参数的方法有两种,一种是线性预测分析,一种是同态分析处理。
同态信号处理的基本原理
我们日常生活中遇到的许多信号,它们并不是加性信号(即组成各分量按加法原则组合起来)而是乘积性信号或卷积性信号,如语音信号、图像信号、通信中的衰落信号、调制信号等。这些信号要用非线性系统来处理。
同态信号处理就是将非线性问题转化为线性问题的处理方法。按被处理的信号来分
您可能关注的文档
最近下载
- 浙江杭州余杭交通集团有限公司招聘笔试题库2023.pdf VIP
- 人工胆囊、人工胆囊设备和人工胆囊在胆囊手术中的应用.pdf VIP
- 重力与弹力高一上学期物理人教版2019必修第一册+.pptx VIP
- 胃癌的诊治现状与进展.pptx VIP
- 数控压装压力机 第2部分:技术条件.docx VIP
- 【课件】匀变速直线运动速度与时间的关系+课件-高一上学期物理人教版(2019)必修第一册.pptx VIP
- XX医院职能部门监管手术、麻醉授权管理督导、检查、总结、反馈及持续改进记录表.pdf VIP
- 电力调度数据网络接入技术规范及网络拓扑图.doc VIP
- ZZGA高频开关整流器使用说明书.doc
- 危重患者院内转运PPT.pptx VIP
文档评论(0)