基于子带谱熵仿生小波语音增强.docVIP

下载本文档

7
0
约7.27千字
约 16页
2018-08-29 发布于福建
举报
版权申诉

基于子带谱熵仿生小波语音增强.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于子带谱熵仿生小波语音增强

基于子带谱熵仿生小波语音增强　　摘要前端噪声处理直接关系着语音识别的准确性和稳定性，针对小波去噪算法所分离出的信号不是原始信号的最佳估计，提出一种基于子带谱熵的仿生小波变换（BWT去噪算法。充分利用子带谱熵端点检测的精确性，区分含噪语音部分和噪声部分，实时更新仿生小波变换中的阈值，精确地区分出噪声信号小波系数，达到语音增强目的。实验结果表明，提出的基于子带谱熵的仿生小波语音增强方法与维纳滤波方法相比，信噪比（SNR平均提高约8%，所提方法对噪声环境下语音信号有显著的增强效果。　　关键词语音增强；子带谱熵；仿生小波变换；去噪；阈值　　中图分类号 TN912.3 　　文献标志码 A 　　0引言　　在自然环境中，语音信号不可避免地会受到周围环境、传输媒介等带来的噪声影响。这些干扰信号使得语音信号不是纯净的原始信号。而语音训练模板是在高保真环境下录制的，这就使得语音信号和训练模板很难匹配，从而使语音识别率降低。语音增强就是要从含噪的语音中提取出尽可能纯净的原始信号，提高语音识别率。　　近年来，语言增强的主要技术包括小波滤波技术[1]、Wiener滤波[2]、自适应滤波器[3]和能量熵[4]，它们在噪声去除方面都取得了一定效果。Donoho等[5]在Mallat的小波理论指导下，将小波分析应用到图像、语音等领域，从此小波方法成为语音增强的一个重要研究方向。小波阈值去噪方法，已被证明效果好于其他方法。小波阈值方法中最关键的是阈值的选取，硬阈值函数对噪声的去除不够干净，软阈值函数能彻底去除噪声，但对语音信号的损害很大[6]。由于小波去噪不能很好地反映人耳对语音信号幅度和频率的听觉特性，2001年Yao等[7]将小波变换和人耳的非线性传输模型相结合，提出了仿生小波变换（Bionic Wavelet Transform， BWT去噪方法。　　针对现有小波去噪方法中存在的不足，本文将子带谱熵端点检测方法与BWT结合，提出一种基于子带谱熵的仿生小波语音增强方法。采用基于子带谱熵端点检测算法，从信号中分离出噪声信号，计算出噪声标准方差。然后，将经子带谱熵所分离的语音信号进行仿生小波动态硬阈值去噪，以达到良好的语音增强效果。　　1子带谱熵端点检测　　1.1谱熵　　Shen等[8]将谱熵引入到语音信号端点检测中。由于信息熵的值只和语音信号能量的随机性有关，与能量幅值无关[9]，语音信号和噪声信号的熵存在着很大的差异。在一段频带较宽的语音信号中，相对于噪声信号而言，语音信号主要集中于某几个频段（主要集中在300～3400Hz，其动态范围广，随机事件多，平均信息量大，对应的熵值大；而噪声信号幅度小，分布相对集中，相应的熵值较小，因此，能比较好地区分语音段和非语音段。　　谱熵原理：　　对带噪语音信号分帧、加窗，帧间重叠50%进行快速傅里叶变换（Fast Fourier Transformation， FFT，得到频率分量的能量谱sω（i， j，每个频率分量的归一化谱概率密度函数定义为：　　P（i， j=sω（i， j∑N-1j=0sω（i， j（1 　　其中　　sω（i， j表示第i帧语音信号第j频率分量的功率谱幅度。sω（i， j=0，如果频率fj3400Hz。　　第i帧语音信号短时谱熵表达式如式（2所示：　　Ha（i=-∑nj=1p（i， jlg p（i， j（2 　　1.2子带谱熵　　由于每一谱点的幅值容易受到噪声的干扰，影响端点的检测。Wu等[10]提出子带谱熵的概念将每一帧语音信号分成若干个子带，对每一个子带求谱熵，这样就解决了幅值受噪声影响的问题。　　子带谱熵[11]表达式如式（3所示：　　Hb（i=∑Nbm=1Pb（m，i*lg[1/Pb（m，i]（3 　　子带能量概率表达式如式（4所示　　Pb（m，i=Eb（m，i∑Nk=1Eb（k，i（4 　　其中　　i≤m≤N，Eb（m，i表示第m个子带的能量，i表示帧数，N表示每一帧语音信号所划分的子带数。根据式（3、（4仿真得到的子带谱熵如图1所示。由图可以看出，语音部分的谱熵值明显高于噪声部分的，噪声部分的熵值平均在0～0.5。　　2仿生小波变换　　人的耳朵由外耳、中耳和内耳组成，中耳和内耳对接收到的声波信号进行增强和补偿，最终由内耳耳蜗的基底膜接收[12]。耳蜗基底膜对不同频率的声波信号具有选择性，对低频信号的分辨能力强于高频信号。Yao等[7]将主动耳蜗理论与小波变换结合，提出来一种时频分析方法――仿生小波变换。仿生小波变换与基本小波变换相比，它在时频域的尺度不仅可以根据语音信号的频率进行调节，而且可以随着信号的幅度和一阶微分系数进行自适应调节。　　2.1仿生小波变换理论　　小波变换是