- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自训练过完备字典和稀疏表示语音增强
自训练过完备字典和稀疏表示的语音增强-电气论文
自训练过完备字典和稀疏表示的语音增强
崔晓
(郑州师范学院,河南郑州450044)
摘要:提出的算法利用带噪信号进行训练以获得过完备字典,通过设定较大的字典训练阈值,训练过程只对语音信号进行,使得自训练字典与语音信号之间相关性较强。利用该字典和较小的阈值对语音信号进行稀疏表示,进而实现语音增强。仿真实验表明,增强后的信号表示系数稀疏度更强,增强效果在信噪比(SNR)和感知语音质量评估(PESQ)得分方面均有较大改进。
关键词 :正交匹配追踪;迭代阈值;字典训练;语音增强
中图分类号:TN912.3?34 文献标识码:A 文章编号:1004?373X(2015)13?0056?03
收稿日期:2015?01?22
基金项目:郑州市普通科技攻关计划项目(141PPTGG365);河南省教育厅科学技术研究重点项目(14A510023)
0 引言
语音信号是人类交流过程中最自然、最常用的方式,语音增强能降低噪声提高信噪比,是语音信号预处理的一个重要过程。在稀疏表示中,利用过完备字典中少数原子的线性组合来表示样本信号,其优势是有更大的灵活性和噪声情况下更强的稳定性,因而成为目前研究较多的算法,在语音压缩[1]、识别[2]以及语音增强[3?4]方面均得到较为广泛的应用。在基于稀疏表示的语音增强中,过完备字典的构成起着一个非常关键的作用[5],良好的字典能够使纯净语音信号的表示更加稀疏,从而与噪声的区分度更为显著。在这个过程中,为了得到更为稀疏的系数,所采用的字典从过完备离散余弦变换、过完备小波变换等固定字典到参数化字典设计,进而采用自适应字典学习算法训练字典,使字典与被处理信号之间的相关性增强[6?7]。文献[8]利用纯净信号训练字典,将语音激活检测估计的噪声作为重构阈值,对含噪语音进行稀疏分解,将系数与字典重构得到无噪的语音信号。然而,在语音增强处理的过程中目标语音是受到噪声污染的,纯净语音只能是其他语音信号。本文算法利用阈值正交匹配追踪(OMP)和K奇异值分解算法(K?svd)直接对含噪语音进行字典训练,得到的字典与语音信号有更强的相关度,因而得到的表示系数更为稀疏,在语音增强时取得更好的效果。
1 带噪语音信号的稀疏重构
对于一个适合的过完备字典D,语音成分在其上的系数是稀疏的,而白噪声则不具备这种特性。当已知噪声方差σ2 的情况下,在进行原子选择时通过设定与其有关的恰当的阈值ε,可以控制只从带噪信号中选出与纯净语音相关的系数,而摒弃与噪声有关的系数以实现语音增强。
2 阈值正交匹配追踪算法
在信号的稀疏表示中,由于字典的过完备性,x 在由D 构成的冗余基上的稀疏表示系数A 的求解是一个非常困难的过程。快速稳定的稀疏分解与重构算法起着重要的作用,OMP属于贪婪方法的一种,在精度要求相同的情况下,OMP 由于更快且更容易实现而得到广泛的应用。
为得到最优的稀疏表示结果,OMP 使第k 个残差Rk 与当前信号的近似值yk 正交,此时该残差与当前yk的任意一个原子都线性无关,从而在之后的分解过程中,不会出现之前yk 中已经选择过的原子,因此是最优的。传统的OMP 先将选中原子进行正交化处理,然后再将残差在这些正交原子基上进行分解,以保证残差与所选中的全部原子正交。改进算法在信号投影过程中,将原信号在所选中的所有原子的列空间进行正交投影,所得残差与这些被选中的原子都正交[9]。本文采用的阈值正交匹配追踪算法中,设定迭代结束的阈值条件,当原始信号与重构信号的残差小于该阈值时,停止迭代。
本文阈值正交匹配追踪算法描述如下:
(1)稀疏编码阶段。对给定的训练样本y ,利用阈值正交匹配追踪从当前的字典D 中选择最佳原子,求出稀疏表示的系数A 。
(2)字典更新。针对步骤(1)得到的稀疏系数A,更新字典中每一列即各个原子。K?svd算法通过对残差矩阵进行奇异值分解,用最大特征值所对应的向量更新字典的一列,同时更新该列相对应的系数A 的行元素,为保证系数的稀疏性,在奇异值分解计算时只用与待更新字典的列有关的残差信号[10]。
4 提出算法描述及性能评估
4.1 算法描述
综前所述,本文提出的语音增强算法可描述为:(1)噪声方差估计。对观测到的带噪语音信号利用其前3 000个样本估计噪声方差σ2 。
(2)字典训练。设定字典训练阈值ε1 = k1 M σ 作为K?svd字典训练时阈值OMP的迭代结束条件,初始化字典选择过完备离
您可能关注的文档
最近下载
- 云南南传上座部佛教“有寺无僧”问题的影响及对策.docx VIP
- 2022年6月18日四川省事业单位联考《综合知识》题含解析.docx VIP
- 2022年11月26日四川省属事业单位联考《综合知识》真题.pdf VIP
- 2022年6月18日四川省事业单位联考《综合知识》试卷试题真题答案解析.doc VIP
- 《房屋建筑制图统一标准》GB50001-2010.pdf
- 2022年5月22日四川成都市属事业单位招聘考试《公共基础知识》真题(含答案).pdf VIP
- 二零二三年4月9日四川省事业单位联考《综合知识》精选题.pdf VIP
- 新股骨颈骨折病人的护理ppt课件.ppt
- 2023年10月29日四川省事业单位联考《综合知识》试题及答案解析.pdf VIP
- 2025至2030全球及中国门窗制造商行业项目调研及市场前景预测评估报告.docx
原创力文档


文档评论(0)