- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理第3章
语音信号的时域基本参数 短时能量及短时平均幅度 短时过零率 语音信号起始点 短时相关性 短时平均幅度差函数 短时能量 设第n帧语音信号xn(m)的短时能量用En表示,则其计算公式如下: 过零示意图 语音信号起始点 示意图 3个不同语音信号的平均过零率 语音信号的自相关函数曲线 语音信号波形-基音周期 2.线性平滑处理 线性平滑是用滑动窗进行线性滤波处理,即: 其中{ω(m),m = -L,-L+1,…,0,1,2,…,L}为2L+1点平滑窗,满足: 例如三点窗的权值可取为{0.25,0.5,0.25}。线性平滑在纠正输入信号中不平滑处样点值的同时,也使附近各样点的值做了修改。所以窗的长度加大虽然可以增强平滑的效果,但是也可能导致两个平滑段之间阶跃的模糊程度加重。以上两种平滑技术可以结合起来使用。 3.组合平滑处理 为了改善平滑的效果可以将两个中值平滑串接,图3-29a所示是将一个5点中值平滑和一个3点中值平滑串接.另一种方法是将中值平滑和线性平滑组合,如图3-29b所示。为了使平滑的基音轨迹更贴近,还可以采用二次平滑的算法,全部算法的框图如图3-29c所示。由于中值平滑和线性平滑都会引入延时,所以在实现上述方案时应考虑到它的影响。3-29d是一个采用裣延时的可实现二次平滑方案。其中的延时大小可由中值平滑的点数和线性平滑的点数来决定。 3.组合平滑处理 3.8 共振峰估计 声道可以看成是一根具有非均匀截面的声管,在发音时起共鸣器的作用。当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。共振峰参数包括共振峰频率和频带宽度,它是区别不同韵母的重要参数。共振峰信息包含在语音频谱包络中,因此共振峰参数提取的关键是估计自然语音频谱包络,并认为谱包络中的最大值就是共振峰。 提取共振峰特性最简便的手段是使用语谱仪。分析共振峰参数也可采用数字信号处理的方法,它可获得与语谱图相同的信息。下面讨论常用的几种。 带通滤波器组法 这种方法类似于语谱仪,但由于使用了计算机,使滤波器特性的选取更具灵活性,实现框图如图3-30所示。这是共振峰提取的最早形式,与线性预测法相比,滤波器组法有些逊色。但通过滤波器组的设计可以使估计的共振峰频率同人耳的灵敏度相匹配,其匹配的程度比线性预测法要好。 滤波器的中心频率有两种分布方法:一种是等间距地分布在分析频段上,则所有带通滤波器的带宽可设计成相同,从而保证了各通道的群延时相同。另一种是非均匀地分布,例如为了获得类似于人耳的频率分辨特性,在低频端间距小,高频端间距大,带宽也随之增加,这时滤波器的阶数必须设计成与带宽成正比,使得它们输出的群延时相同,不会产生波形失真。 带通滤波器组法 倒谱法 虽然可以直接对语音信号求离散傅里叶变换(DFT)。然后用DFT谱来提取信号的共振峰参数,但是,直接DFT的谱要受基频谐波的影响,最大值只能出现在谐波频率上,因而共振峰测定误差较大。为了消除基频谐波的影响,可以采用同态解卷技术,经过同态滤波后得到平滑的谱,这样简单地检测峰值就可以直接提取共振峰参数,因而这种方法更为有效和精确。因为倒谱运用对数运算和二次变换将基音谐波和声道的频谱包络分离开来。因此用低时窗l(n)从语音信号倒谱c(n)中所截取出来的h(n),能更精确地反映声道响应。这样,由h(n)经DFT得到的H^(k),就是声道的离散谱曲线。用H^(k)代替直接DFT的频谱,因为去除了激励引起的谐波波动,所以可以更精确地得到共振峰参数。 倒谱法 图3-31所示为倒谱法求取语音频谱包络的原理。实验表明,倒谱法因为其频谱曲线的波动比较小,所以估计共振峰参数的效果是较好的,但其运算量太大。 倒谱法 从线性预测导出的声道滤波器是频谱包络估计器的最新形式,线性预测提供了一个优良的声道模型(条件是语音不含噪声)。尽管线性预测法的频率灵敏度和人耳不相匹配,但它仍是最廉价、最优良的行之有效的方法。 用线性预测可对语音信号进行解卷:即把激励分量归入预测残差中,得到声道响应的全极模型H(z)的分量,从而就得到这个分量的ai参数。另外,也可以采用抛物线内插技术,解决频率分辨率较低的情况下的共振峰频率值的求取,它的原理如图3-22所示。 倒谱法 这一章讨论了语音信号数字处理的一些基本问题和最重要或常用的若干处理方法,这些内容对语音信号数字处理的任何一个研究领域都是必需的,基中贯穿全书的是语音信号产生模型和语音信号的短时分析技术。 线性预测分析的基本原理 线性预测分析的基本思想是:用过去p个样点值来预测现在或未来的样点值: 预测误差ε(n)为: 这样就可以通过在某个准则下使预测误差ε(n)达到最小值的方法来决定惟一的一组线性预测系数ai(i=1,2,
您可能关注的文档
最近下载
- 2025年天津市专业技术人员公需考试试题-为中国式现代化提供强大动力和制度保障——党的二十届三中全会暨《中共中央关于进一步全面深化改革、推进中国式现代化的决定》总体解读.docx VIP
- 2024版建筑园林施工合同.docx VIP
- 2024高中化学课程标准考试模拟试卷附答案(三套) .pdf VIP
- 发展党员工作需要把握的47个时间节点.xlsx VIP
- 工会主席在XX市烟草专卖局(公司)党组理论学习中心组学习会上的研讨发言.doc VIP
- 自考英语二2024年10月真题及答案.docx
- 手持式电批说明书.docx VIP
- 钢结构厂房施工进度计划横道图(1)(1).pdf VIP
- 机械制造工艺学课程设计-拔叉工艺及夹具设计.doc VIP
- 2023年5月人力资源管理师二级真题及理论部分答案.pdf VIP
文档评论(0)