- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国科技论文在线
( )
第 25 卷第 6 期 苏 州 大 学 学 报 工 科 版 Vol. 25 No. 6
2005 年 12 月 JOURNAL OF SOOCHOW UNIVERSITY( ENGINEERING SCIENCE EDITION) Dec. 2005
( )
文章编号 :1673 - 047X 2005 06 - 0001 - 04
改进 VQ 算法在说话人识别中的应用
张庆芳 ,赵鹤鸣
(苏州大学电子信息学院 ,江苏 苏州 215021)
摘 要 :与文本无关的说话人识别方法是当前说话人识别技术的研究重点 。基于矢量量化的说话
人识别 ,因其运算过程简单等特点 ,在说话人识别领域有着广泛的应用 。本文对矢量量化的码书形
成算法进行了改进 ,并基于改进算法进行了与文本无关的说话人识别 。经实验结果证明 ,本文的方
法改善了码本的性能 ,提高了说话人识别的识别率 。
关键词 :说话人识别 ;与文本无关 ;LBG算法 ; 自组织特征映射网络
中图分类号 :TN912 文献标识码 :A
0 引言
随着计算机技术与信息化社会的发展 ,说话人识别 SR ( Speaker Recognition) 技术的应用领域正在不断扩
大 ,说话人识别技术越来越受到学术界的关注 。与文本无关的说话人识别方法是当前说话人识别技术的研
究重点 。研究者尝试过的方法很多 , 比较常用的有 :基于 VQ[1 ,4 ] 的方法 、基于 HMM 的方法 , 以及基于人工神
经网络的方法等 。其中 ,基于矢量量化法的说话人识别 ,一方面用若干离散的数字值来表示各种矢量 ,能够
大大压缩信息量 ,减少数据存储量 ;另一方面又可避免困难的语音分段问题和时间归正问题 ,而且无需考虑
复杂的统计模型 ,因此在说话人识别领域有着广泛的应用 。在基于 VQ 的识别系统中 ,码本设计的优劣影响
VQ 算法识别的性能 ,在码本优化方面已有很多研究成果[2 ,3 ,5 ,7 ,8 ,9 ] ,本文对矢量量化的码书形成算法进行了
改进 ,研究了自组织特征网络的结构 ,改进了码书的性能 ,并基于改进的算法进行了与文本无关的说话人识
别 。
1 基于矢量量化的说话人识别原理
( )
矢量量化 VQ 是一种很重要的数字信号处理方法 。在说话人识别中 ,可以把每个待识别说话人的语音
看作一个信号源 ,用一个码本来表征 。如图 1 所示 ,训练就是对 N 个人的系统建立个码本 。码本在特征空
间中相互不重叠 。识别时, 先从测试语音中提取一组矢量 O = { o , o , …, o } ; 然后用系统中建立的 N 个码
1 2 T
本依次对它们进行矢量量化, 即判断这组矢量与特征空间中的哪一个码本的分布最为吻合 。设这个码本的
码字数分别为 M 。可以定义第 i 个码本的平均量化失真距离 ε为
文档评论(0)