基于三阶累积量的语音信号的基音周期检测.pdfVIP

基于三阶累积量的语音信号的基音周期检测.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于三阶累积量的语音信号的基音周期检测.pdf

第13卷第3期 电路与系统学报 V01.13No.3 ANDSYSTEMS 2008 2008年6月 JCII瓜NALOFCIRCUITS June, 文章编号:1007-0249(2008)03-0053-04 基于三阶累积量的语音信号的基音周期检测· 史笑兴, 于慧敏 (浙江大学信息与电子工程系,浙江杭州310027) 摘要。本文提出了一种新的语音信号的基音周期检测方法,该方法根据语音信号的三阶累积量去确定语音信号的 基音周期,能有效地排除白色或有色的高斯加性噪声所带来的干扰。与传统的基音周期估计的自相关函数法或平均幅 度差函数法(AMDF)相比,该方法更精确、有效,具有更强的鲁棒性。 关键词。基音周期检测;自相关函数iAMDF;三阶累积量 中图分类号·TN912.34文献标识码tA 1 引言 根据人的发声模型,语音信号基本上可以分为两大类,一类是清音,另一类是浊音。从语音信号 的时域波形来看,清音是随机噪声激励声道系统而产生的输出,呈现为随机噪声;而浊音则是准周期 脉冲激励声道系统产生的输出,呈现为准周期信号。就能量而言,浊音部分的能量远远高于清音部分, 人耳所能感受到语音能量,绝大部分源自于浊音。 基音周期是浊音信号的基波周期,它是浊音语音的一个非常重要的特征参数,它在语音编码、语音 合成以及语音识别等方面都有着非常重要的作用。目前,绝大多数的基音周期估计方法都是基于自相 关函数或平均幅度差函数(AMDF)【lJ。对于纯净的语音信号,这两类方法能够得到较精确的基音周 期的估计值;然而对于含有噪声的语音信号,情况就变得不那么乐观了。 如果干扰噪声为高斯白噪声,由于白噪声的自相关函数是一个关于延时量的脉冲[2J,当噪声功率 较低,即语音信号的信噪比较高时,仍可以通过自相关函数得到基音周期的较精确的估计值。但如果 干扰噪声为高斯有色噪声,由于有色噪声的自相关函数,当延时量不为零时,仍然有值,这时采用自 相关函数将很难得到基音周期的精确估计值。 累积量作为随机信号的一种统计参量,具有自相关函数所不具备的一些特点,例如对于服从高斯 分布的随机信号(白色或有色),其三阶以上的累积量为零13’;累积量还具有半不变性,如果观察信号 中的干扰噪声与语音信号相互独立,则观察信号的累积量为语音信号的累积量与干扰噪声的累积量之 和【3】。利用累积量的这些特点,本文提出了一种新的基音周期的估计方法,这种方法将特别适用于含 有高斯有色干扰噪声的语音信号。 高斯噪声呻t) 2 浊音语音的基音周期估计问题 7语音信号的产生模型如图1所示吲。其中文,1)为 语音激励,对于浊音信号,e(n)为准周期脉冲;声 图1语音信号的发声模型 一个准周期信号;v(n)为高斯干扰噪声(白色或有色)与J(胛)统计独立;观察语音信号为 周期是一致的。 ’收稿日期·2005-05·16修订日期:2005—07一12 基金项目·浙江省教育厅基金资助项目 电路与系统学报 第13卷 3 基音周期估计的传统方法及其特点 常用的基音周期估计方法主要有两种,一种是基于短时自相关函数,另一种是基于短时AMDF。 它们的定义分别为: 短时自相关函数: R(七)=∑s。(研如。(加+七) (1) [gm.-.oO oo. AMDF: r(k)=:∑p。(,”)一J。(,竹+后)l (2) 七=—∞ 这里s,.,(聆)为加窗语音。对于浊音语音,s。(

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档