- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章语音检测分析
* 9.2共振峰估值 ——离散傅里叶变换 2清音时 信号具有随机噪声的特点,其频谱不具有离散谐波特性,但其包络基本上反映了声道的特性。 对其频谱进行线性平滑而得到谱包络,并用一个峰值搜索算法来确定峰值,并标记为共振峰参数。 * 9.2共振峰估值 ——倒谱法 第一项为声门激励序列的倒谱,它是以基音周期为周期的冲激序列;而第二项为声道冲激响应序列的倒谱,它集中在n=0附近的低倒谱域。因而可在倒谱域用一个滤波器滤除声门激励的影响。这个滤波器称为倒滤波器,其形式为 l(n)=1,|n|<n0 l(n)=0,|n|≥n0 其中n0值应选得比基音周期NP小,这样可将声道冲激响应的倒谱提取出来。再对倒谱进行DFT就得到声道模型的对数谱ln|H(k)|,而所求得的频谱包络的平滑程度根据使用倒滤波器的不同成分而发生变化。 利用IDFT求c(n)时,与时域取样类似,为避免发生混叠,需要将N取得足够大 * 9.2共振峰估值 ——倒谱法 对于浊音和清音,倒谱法的检测效果不同: ① 浊音时,若频谱包络的变换和基音峰值的变换在倒谱域中的间隔足够大,则前者很容易识别。而声道冲激响应h(n)的倒谱的特性取决于声道传递函数H(z)的极零点分布。当H(z)的极零点的模不是很接近于1时,将随n的增加而迅速减小。 ② 清音时,声门激励序列具有噪声特性,其倒谱没有明显峰值,且分布于从低倒谱域到高倒谱域的很宽的范围内,因而在低倒谱域对声道响应的信息产生了影响。因而求得的声道模型对数谱与实际的声道对数谱之间将存在一定差别。 * 9.2共振峰估值 ——倒谱法 同时倒谱法有两个问题难以解决: ① 并不是所有的谱峰都为共振峰; ② 带宽的计算。当两个共振峰很靠近时,发生谱重叠,很难从频谱曲线计算共振峰的带宽。而且峰值检测器认为此处只存在一个共振峰。 * 9.2共振峰估值 ——LPC法 LPC法可对语音信号进行参数解卷,它所提供的谱包络恢复方法快速、准确并且在理论上完全得到了证明。 LPC法的不足是其频率灵敏度和人耳不相匹配,但它仍然是一种最廉价、最优良的行之有效的方法。这是因为线性预测方法提供了一个优良的声道模型(条件是语音基本上不含噪声)。 * 9.2共振峰估值 ——LPC法 用LPC进行共振峰估计有两种方案: 对全极模型的分母多项式A(z)进行因式分解,即用任何一种标准的求取复根的程序确定A(z)的根,根据求得的根来确定共振峰。这种方法称为求根法。 进行LPC谱估计。LPC谱的特点是在信号的峰值处和信号谱匹配得很好,因此能够准确地求得共振峰参数;即求出语音谱包络后,搜索包络上的局部极大值,用峰值检测器确定共振峰。 同态处理提取谱包络原理与LPC分析很不相同,它不依赖于模型假定,而通过倒谱窗在倒谱域进行平滑,因此得到的共振峰带宽较宽。而LPC法常常可以得到比较尖锐的共振峰估计,比实际的共振峰可能还要窄。 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * * * 第九章语音检测分析 9.1基 音 检 测 自相关法 并行处理法 倒谱法 简化逆滤波法 9.2共振峰估值 带通滤波器组法 离散傅里叶变换(DFT) 倒谱法 LPC法 语音检测分析主要涉及语音特征参数的提取和分析。 * 9.1基 音 检 测 基音是语音信号的一个重要参数,在语音产生的数字模型中它也是激励源的一个重要参数。基音是指发浊音时声带振动所引起的周期性,而基音周期是指声带振动频率的倒数。 准确地检测语音信号的基音周期对于高质量的语音分析与合成、语音压缩编码、语音识别和说话人确认等具有重要的意义。 * 9.1基 音 检 测 基音检测的主要困难反映在: ① 声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。 ②在许多情况下,清音语音和低电平浊音语音段之间的过渡段是非常细微的,确认它是极其困难的。 ③ 从语音信号中去除声道影响,直接取出仅和声带振动有关的激励信号的信息并不容易,例如声道的共振峰有时会严重影响激励信号的谐波结构。这种影响在发音器官快速动作而共振峰也快速改变时,对基音检测是最具危害性的。 * 9.1基 音 检 测 ④ 语音信号包含有十分丰富的谐波分量,基音频率最低可达80Hz左右,最高可达500Hz左右,但基音频率处在100~
文档评论(0)