- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于子带能量的特征参数鲁棒性说话人辨认
王金甲。王成儒①李静⑦
①(燕山大学通信与电子工程系066004)
②(燕山大学数学系河北秦皇岛066004)
摘 要本文根据多级子带和能量算子,提出了一种子带能量倒谱算法用于说话人辨认。实
验结果表明在加性噪声环境下新参数比传统参数识别性能有显著的提高。
关键词话人辨认多级子带Teager能量算子
提高说话人识别系统的鲁棒性是说话人识别技术走向实用的关键问题,因而噪声环境下
的识别是目前该领域的研究热点。噪声鲁棒性的基本矛盾是:当系统的训练环境与应用环境
失配时,说话人识别性能显著下降。其中鲁棒性特征参数的提取又是关键问题。到目前为止,
还没有一种很好的方法能将说话人的个性特征从语音特征中完全分离出来。这方面的鲁棒性
参数的改进算法有:对特征参数进行加权或滤波;对滤波器组结构的改进;白相关的特征参
数;将各种参数结合起来使用等等。但是它们在低信噪比时识别性能并没有本质的提高。解
决这一基本矛盾还必须从人耳听觉感知角度出发,依赖生理声学和心理声学的研究成果,对
人耳识别语音性能进行模拟和研究。子带识别的方法可以模拟入耳听觉的这种特性[1112],并
且子带倒谱参数性能比传统的利用听觉频率非线性的Mel倒谱稍好。此外,Teager能量算子
已经成功的应用在各种语音处理中【3】【4】,能有效的去除汽车发动机噪声和色噪声。基于多级
子带和能量算子,本文提出了一种新的鲁棒性语音特征参数。语音信号首先在Mel刻度上利
用多级滤波器组被分解不均匀的子带,然后估计子带信号的Teager能量,最后通
过对数压缩和反离散余弦变换(IDCT)就得到了特征矢量。
全文安排如下:首先讨论Teager能量算子方法,其次公式化定义了基于子带能量的倒谱
特征参数,然后新的特征用在闭集独立文本说话认识别中,在各种加性噪声条件下实验结果
表明子带能量倒谱参数(SUBEC)比MFCC和基于子带补偿的倒谱参数(SUBC)识别性能更好。
1Teager能量算子
对于连续时间信号和离散时间信号,Teager能量算子分别定义为:
矽bO)】=lsO)l—s(f)sO) (1)
≯b(玎)】=s2G)一s(n+1)s(n一1) (2)
s。本文只用离
这里J(,)和jo)分别是一维连续和离散时间信号,40=妄,;(,)=百d
散时间信号Teager能量算子。假定sO)是宽带意义下的离散静态随机信号,那么有:
(3)
E{≯p(啪=Ep2G)}一Ep(阿+1弦(聆一1)}
615
E移pG强=Rs(o)~R。(2) (4)
这里火,@)是J0)的自相关函数。
一般的,色噪声dO)大多数是低通的,可由4R(f)序列模拟
,
dO)=∑口。dO—f)+wG) (5)
这里w(,)是零均值方差为盯2的白高斯噪声。注意到dO)是一零均值宽带意义的离散静态
随机过程。
对于某些语音色噪声信号,头三个自相关延迟的关系估k-t-如T
Rd(1)=0.9997Rd(0)和
R,(2)=0.4584R,(0),三者是不相等的。
实际上观测到的信号是纯净语音信号和噪声信号的叠加,其模型为x0)=JG)+dG)。
噪声污染的语音信号的Teager能量算予定义为:
(6)
文档评论(0)