- 1、本文档共79页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3讲语音信号处理第3.1~3.5章,语音信号处理,离散时间语音信号处理,语音信号处理pdf,matlab语音信号处理,语音信号处理赵力,语音信号数字处理,语音信号处理与滤波,语音信号的处理与滤波,语音信号处理胡航
预加重的频谱提升作用 Hamming window 2.修正的短时自相关函数 随着延迟k的增加,进行乘积和的项数在减少,导致自相关函数的幅度值随着延迟k的增加而下降 不利于基频估计 过大的N影响短时性 修正的短时自相关函数 严格意义不是自相关,而是互相关 在周期信号的周期的倍数上有峰值,与R(0)最接近的第一个最大值点仍然代表了基音周期的位置 利用语音的短时傅里叶变换求语音的短时谱 对第n帧语音信号xn(m)进行傅里叶变换(离散时域傅里叶变换,DTFT),可得到短时傅里叶变换,其定义如下: 短时傅里叶变换的等效性 时宽、带宽积 为常数 窗形对STFT频谱的影响 矩形窗:频率分辨率高(主瓣狭窄尖锐),第一旁瓣衰减较小 汉明窗:在频率范围中的分辨率较高,且旁瓣的衰减大,具有频谱泄漏少的优点 窗对频谱的影响 临界带特征 求功率谱 确定临界带划分 计算临界带特征值 构建临界带特征 倒谱分析实例:MEL频率倒谱参数(MFCC) MFCC(Mel-Frequency Cepstral Coefficents MFCC) 着眼于人耳的听觉特性,因为,人耳所听到的声音的高低与声音的频率并不成线性正比关系,而用Mel频率尺度则更符合人耳的听觉特性。 所谓Mel频率尺度,它的值大体上对应于实际频率的对数分布关系。 MFCC MFCC的计算方法 FFT LPC变换法 类似于临界频带的划分,Mel滤波器组将语音频率划分成一系列三角形的滤波器序列,即Mel滤波器组。 Mel滤波器组 Mel频率 线性频率 ml ml ml 梅尔滤波器组的划分 在Mel频率轴上配置L个三角形滤波器, L的个数由信号的截止频率决定. 每个三角形滤波器的中心频率c(l)在Mel频率轴上等间隔分配. o(l),c(l)和h(l)分别是第l个三角形滤波器的下限,中心和上限频率 相邻三角形之间的下限,中心和上限频率的关系: 相邻三角形滤波器之间的关系 f c(l) h(l-1) o(l+1) l l-1 l+1 c(l+1) h(l) c(l-1) o(l+1) 梅尔滤波器组的划分 中心频率f(m)可以用下面的方法定义: 其中 、 为滤波器的频率应用范围的最低频率和最高频率, N为DFT(或FFT)窗宽, 为采样频率,而 为B的逆函数: 梅尔滤波器组的中心频率 当m值小时,相邻f(m)之间的间隔也小,随着m的增加 , f(m)的间隔逐渐变大 Mel频率滤波器组即为在语音的频谱范围内设置的若干个带通滤波器 M为滤波器的个数。每个滤波器具有三角滤波特性,其中心频率为f(m), 每个带通滤波器的传递函数为: 梅尔滤波器组的传递函数 幅度谱 Mel滤波 MFCC 短时平均幅度差函数 对于实际的语音信号,d(n)虽不为零,但其值很小。这些极小值将出现在整数倍周期的位置上。为此,可定义短时平均幅度差函数: 可以证明平均幅度差函数和自相关函数有密切的关系,两者之间的关系可由下式表达: 短时平均幅度差函数 图3-9 AMDF 的例子 3.4 语音信号的频域分析 从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,常用的频域分析方法有 带通滤波器组法 傅里叶变换法 线性预测法 …… 本节介绍傅里叶分析法。因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。 (3-27) 短时傅里叶变换实际就是窗选语音信号的标准傅里叶变换 窗ω(n)是一个“滑动的”窗口 窗长是有限的,满足绝对可和条件,变换是存在的。 窗函数不同,傅里叶变换的结果也不同。 加矩形窗 加汉明窗 式(3-27)可写成另一种形式。设语音信号序列和窗口序列的标准傅里叶变换均存在。当n取固定值时,ω(n-m)的傅里叶变换为: 根据卷积定理有: 上式右边两个卷积项均为关于角频率ω的以2π为周期的连续函数,所以也可将其写成以下的卷积积分形式: 即,假设x(m)的DTFT是X(ejω),且ω(m)的DTFT是X(ejω),那么Xn(ejω)是X(ejω)和W(ejω)的周期卷积。 功率谱:根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之间的关系: 或者: 功率谱Sn(ejω)是短时自相关函数Rn(k)的傅里叶变换。 临界带特征从人耳对频率高低的非线性心理感觉角度反映了语音短时幅度谱的特征 3.5 语音信号的倒谱分析 语音信号的倒谱分析就是求取语音倒谱特征参数的过程,它可以通过同态处理来实现。 同态信号处理也称为同态滤波,它实现了将卷积关系变换为求和关系的分离处理,即解卷。 对语音信号进行解卷,可将语音信号的声门激励信息及
您可能关注的文档
- 第3章 ARM指令集-第5课.ppt
- 第3章 离散时间信号与系统的频域分析.ppt
- 第3章 MATLAB作图.ppt
- 第3章 C 控制语句.ppt
- 第3章 3 需求曲线与消费者行为理论.ppt
- 第3章 P坐标系和广义垂直坐标.ppt
- 第3章 三维运动估计.ppt
- 第3章 关系数据库设计.ppt
- 第3章 动态规划3.ppt
- 第3章 分析化学中.ppt
- 第十三讲肿瘤放射生物学.ppt
- 人工智能在区域教育均衡发展中扮演的角色:初中家长培训体系构建教学研究课题报告.docx
- 《体育游戏在小学体育教学中的趣味性与学生兴趣激发研究》教学研究课题报告.docx
- 高中语文教学逻辑思维培养的跨学科融合研究教学研究课题报告.docx
- 2025至2030中国低压电线行业市场运行分析及竞争格局与投资方向报告.docx
- 高中历史哲学思想教学中的AI智能推荐学习资源的冷启动研究教学研究课题报告.docx
- 智慧校园智能学习环境构建中的隐私保护与数据治理关键技术探讨教学研究课题报告.docx
- 3 《农村公路建设对农村地区农村医疗卫生服务的带动作用与效益分析》教学研究课题报告.docx
- 基于劳动教育的初中学生职业规划意识培养研究教学研究课题报告.docx
- 2025至2030中国低压电器市场发展机遇及供需平衡趋势预测报告.docx
文档评论(0)