- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理课件第09章语音检测分析-精品
第九章语音检测分析 9.1基 音 检 测 自相关法 并行处理法 倒谱法 简化逆滤波法 9.2共振峰估值 带通滤波器组法 离散傅里叶变换(DFT) 倒谱法 LPC法 9.1基 音 检 测 基音是语音信号的一个重要参数,在语音产生的数字模型中它也是激励源的一个重要参数。基音是指发浊音时声带振动所引起的周期性,而基音周期是指声带振动频率的倒数。 准确地检测语音信号的基音周期对于高质量的语音分析与合成、语音压缩编码、语音识别和说话人确认等具有重要的意义。 9.1基 音 检 测 基音检测的主要困难反映在: ① 声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。 ②在许多情况下,清音语音和低电平浊音语音段之间的过渡段是非常细微的,确认它是极其困难的。 ③ 从语音信号中去除声道影响,直接取出仅和声带振动有关的激励信号的信息并不容易,例如声道的共振峰有时会严重影响激励信号的谐波结构。这种影响在发音器官快速动作而共振峰也快速改变时,对基音检测是最具危害性的。 9.1基 音 检 测 ④ 语音信号包含有十分丰富的谐波分量,基音频率最低可达80Hz左右,最高可达500Hz左右,但基音频率处在100~200Hz的情况占多数。因此,浊音信号可能包含有三四十次谐波分量,而其基波分量往往不是最强的分量。因为语音的第一共振峰通常在300~1 000Hz范围内,这就是说,2~8次谐波成分常常比基波分量还强。丰富的谐波成分使语音信号的波形变得非常复杂,经常发生基频估计结果为实际值的二、三次倍频或二次分频的情况。 ⑤ 在浊音段很难精确地确定每个基音周期的开始和结束位置,这不仅因为语音信号本身是准周期性的(即音调是有变化的),还由于波形的峰或过零受共振峰的结构、噪声等的影响。 ⑥ 在实际应用中,背景噪声强烈影响基音检测的性能,这对于移动通信环境尤为重要,因为经常会出现高电平噪声。 ⑦ 基音频率变化范围大,从老年男性的80Hz到儿童女性的500Hz,接近三个倍频程,给基音检测带来了一定的困难。 9.1基 音 检 测 基音检测方法的研究: ① 稳定并提取准周期性信号的周期性方法; ② 因周期混乱,采取基音提取误差补偿的方法; ③ 消除声道(共振峰)影响的方法。在基音提取时,容易错误地提取真正基频两倍的频率(倍基音)和基频一半的频率(半基音),至于产生哪种错误随抽取方法而变化。 9.1基 音 检 测 基音检测的方法大致可分为三类: ① 波形估计法。直接由语音波形来估计,分析出波形上的周期峰值。其特点除了比较简单、硬件实现容易外,还可定出峰值点的位置,这在一些处理中是很有用的。 ② 相关处理法。在时域中,周期信号的最明显特征就是波形的类似性,因而可以通过比较原始信号和它位移后的信号之间的相似性来确定基音周期。如果移位距离等于基音周期,那么,两个信号具有最大类似性(相关性最强)。大多数现存的基音检测法都基于这一概念,最具代表性的是自相关函数法。这种方法在语音信号处理中被广泛使用,这是因为相关处理法抗波形的相位失真强,另外它在硬件处理上结构简单。 ③ 变换法。将语音信号变换到频域或倒谱域来估计。比如倒谱法(CEP) 。虽然倒谱分析算法比较复杂,但基音估计效果较好。 9.1基 音 检 测 9.1基 音 检 测——自相关法 浊音信号的自相关函数在基音周期的整数倍位置上出现峰值,而清音的自相关函数没有明显的峰值出现;因此检测是否有峰值就可判断是清音或浊音,检测峰值的位置就可提取基音周期值。 短时自相关函数中保留的语音信号的幅度太多,它有许多峰值,而其中许多都起因于声道响应的阻尼振荡。当基音的周期性和共峰峰的周期性混叠在一起时,被检测出来的峰值就会偏离原来峰值的真实位置。 9.1基 音 检 测——自相关法 主要问题是第一共振峰可能对基音造成干扰:在某些浊音中,第一共振峰频率可能会等于或低于基频;如果其幅度很高,就可能在自相关函数中产生一个峰值,而该峰值又可以同基频的峰值相比拟。 例: 其中有3个明显的峰值。通过自相关波形,可以确定位于第40个样本时延处的峰值相应于基频为200Hz;而位于第20个样本处的峰值与相应于基频时的峰值差不多一样大,因而可能将其误认为基音。 9.1基 音 检 测——自相关法 处理思路: 对语音信号进行预处理以去除声道响应的影响及其他带来扰乱的特征 分析:语音信号的低幅度部分包含大量的共振峰信息,而高幅度部分包含大量的基音信息。 方法之一:非线性处理。非线性处理的优势是在采用硬件时可在时域低成本地实现。 处理效果:任何削减或者抑制语音低幅度部分的非线性处理都会使自相关函数的性能得到改善。 9.1基 音 检 测——自相关法 9.1
您可能关注的文档
- 高中地理如何看待農民工现象课件人教版必修二.ppt
- 诗歌鉴赏之常见表现手法1.ppt
- 诗经两首《静女》《采薇》教学课件.ppt
- 人口的数量变化——上课1.ppt
- 诗经二首静女、采薇-课件.ppt
- 高中歷史人民版必修一中国早期政治制度的特点.ppt
- 人口的数量变化-新人教版.ppt
- 诗经二首静女、采薇二十一.ppt
- 高中生物《第五章第三節血红蛋白的提取和分离》课件6新人教版选修1.ppt
- 诗经二首静女、采薇课件.ppt
- 2025年智能快递驿站行业政策与市场机遇报告.docx
- 2025年校园安全防范中新能源电动巡逻车采购可行性分析.docx
- 2025年智能垃圾分类智慧监管平台在智慧旅游区的应用前景研究.docx
- 2025年智能家居报告:人工智能伦理风险的法律责任与用户隐私保护.docx
- 2025年智能垃圾分类与垃圾分类信息化管理结合的可行性研究.docx
- 2025年智慧社区远程医疗诊断中心在基层医疗机构运营管理中的应用报告.docx
- 2025年智慧社区:老年活动广场智能化升级研究.docx
- 2025年智能社区新能源电动巡逻车市场应用前景分析报告.docx
- 2025年智能垃圾分类智慧监管平台在垃圾分类回收与处理中的智能化改造路径.docx
- 2025年本土半导体材料产业链国产化战略布局报告.docx
文档评论(0)