- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于独立分量分析的说话人识别技术
邱作春,曾庆宁
桂林电子科技大学 信息与通信学院, 广西,桂林(541004)
E-mail: qiuzch@163.com
摘 要:独立分量分析方法是一种将线性混合信号进行分离,得到统计独立的源信号的技术,
能用于提取组合语音的特征基函数。倒谱矢量符合ICA 变换的假设条件,用ICA方法对MFCC
特征进行转换得到ICA特征基,继而用于说话人识别,建立了一个基于独立分量分析的说话
人识别系统。实验结果表明,在噪声环境下此系统具有更高的识别率。
关键词:独立分量分析;说话人识别;矢量量化;高斯混合模型
中图法分类号:TN912.3 文献标识码:A
输出尽可能非高斯化,在输出分量y 方差恒
0.引言
定的情况下,将输入 x 各分量做线性组合
说话人识别(Speaker Recognition)是 y ∑i w x ,优化选择各权重w ,使y 尽可
i i i
一种重要的个人身份识别手段,在当今国家 能非高斯化,则y 的非高斯性的每一个局部
基础设施和高新技术服务领域,国家、公司、 最大值给出一个独立分量。
个人的机密、财产、信誉等需要越来越高的 负熵可以用来度量信号的非高斯程度。
识别、支配与使用等安全措施,说话人识别 概率论中的中心极限定理表明,在一定条件
正是这样的一种安全技术。 下,多个独立分布的和的分布趋向于高斯分
目前,无噪声的说话人识别系统已达到 布。在盲源分离问题中,观测信号是多个独
较高的识别率,但当受到噪声影响时,系统 立源信号的线性组合,其高斯性比源信号的
的识别率将急剧下降。通常噪声却又不可避 高斯性强。反过来说,就是源信号的非高斯
免,比如有空调声的会议室、发动的汽车、 性比观测信号的非高斯性强。非高斯性越强
行驶的轮船、轰鸣的工厂等。因此研究噪声 信号间越独立,因此可以将非高斯性作为
环境下说话人识别系统的稳健性,具有十分 ICA 的一个准则,来判断信号的分离程度。
重要的意义。 而负熵用来度量信号的非高斯性,所以可以
利用基于麦克风阵的盲源分离算法对 用负熵作为ICA的准则。同时,信息论表明,
含噪语音进行处理,得到较为纯净的语音, 在具有同协方差矩阵的分布中,高斯分布的
计算出 MFCC 特征,然后用 ICA 对其转换, 熵最大,用负熵表示一个分布与高斯分布之
得到一种 ICA基函数系数特征,将其用于说 间的偏离程度,即非高斯性。定义负熵J (y )
话人识别。 为:
1. 独立分量分析 J (y ) H (y gauss ) −H (y )
(1)
本文使用的是基于负熵的 ICA 固定点算
其中H (y ) 表示
文档评论(0)