一种基于听觉掩蔽的语音增强方法 .pdfVIP

一种基于听觉掩蔽的语音增强方法 .pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

维普资讯

第22卷第2期成都信息工程学院学报Vo1.22No.2

2007年4月JOURNALOFCHENGDUUNIVERSITYOF1NFORMATIONTECHNOLOGYApr.2007

文章编号:1671.1742(2007)02.0205.04

种基于听觉掩蔽的语音增强方法

申艳红,罗代升,龙建忠

(四川大学电子信息学院图像信息研究所,四川成都610064)

摘要:提出了一种基于谱减法的语音增强算法。算法利用人耳的听觉掩蔽效应动态确定每一帧的权值,有选

择地增强。实验结果表明,方法有效抑制了背景噪声和音乐噪声并提高了语音质量。

关键词:听觉掩蔽;谱减法;语音增强

中图分类号:TN912.35文献标识码:A

1引言

目前,许多语音识别系统在实验室环境下的性能已经达到了实用的地步,但是,在噪音环境下,特别是在低信

噪比下性能急剧地下降。因此,作为语音识别系统的前端预处理模块,语音增强成为语音信号处理领域里的热点

研究之一,具有现实意义。语音增强的目的是从含噪语音中尽可能地提取出原始数据。语音增强主要有基于语

音幅度谱估计和基于发声模型两种算法。基于语音幅度谱估计的主要有谱减法,维纳滤波法,最小均方误差

MMSE)(估计法【l;基于发声模型主要有:隐马尔柯夫模型HMM)(等。其中前者一直是研究的热点。

谱减法[2,3]是目前最常用的语音增强技术,其原理简单,易于实现,且计算量小,但是会引入令人讨厌的“音

乐噪声”【。为此,提出了一种基于听觉掩蔽效应进行加权来改进谱减法。实验结果表明,该方法有效增强了语

音并消除了背景噪音和音乐噪声。

2基本谱减算法

首先,假设加性噪声与短时平稳的语音信号是相互独立的。设(t)表示纯净的语音信号,(t)表示噪音信

号,(t)表示含噪语音信号。则有下式:

Y(t)=(t)+(t)

经傅立叶变换后得到:

y)(=S()+N()

式中,Y()、S(∞)和N()分别表示Y(t),(t)和(t)的傅立叶变换。

由上式可得:

ly)(l=lS()l2+lN()l+2Re[S()N()]

因而有:

E(1y)(l)=E(1S()l)+E(1N()l)+2E{尺[S()N(∞)]}

因为(t)和(t)相互独立,则可得S()和N()相互独立。由N()是零均值高斯分布,则可知E{[S(∞)

N()]}为零。于是有下式:

E(1y)()l=E(1S()I)+E(1N())l

由于语音是短时平稳的,因此在一帧之内有:

ly)(l=IS()l+lN()l

因而,估计的纯净语音值为:

lS()l=(1y)(l一lN())l/2

由于人耳对语音的相位感觉不太敏感,可以用带噪语音的相位代替纯净语音的相位来进行傅立叶反变换,从

收稿日期:2006—09—19;修订日期:2006.10.25

文档评论(0)

185****4542 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档