说话人识别研究综述【荐】.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
说话人识别研究综述 王书诏,邱天爽 大连理工大学电子与信息工程学院(116023) E-mail:wangshuzhao2002@163.com 摘 要:说话人识别是语音信号处理中的重要组成部分,是当前的研究热点之一。本文详细 介绍了说话人识别的基本原理,从特征提取、模型训练和分类等几个方面近年来的主要研究 情况及进行综述和评价,并在此基础上探讨其研究难点和发展前景。 关键词:说话人识别;特征提取;模型训练;分类 1.引言 说话人识别作为生物认证技术的一种,是根据语音波形中反映说话人生理和行为特征的 语音参数,自动鉴别说话人身份的一项技术[1]。为此,需要从各个说话人的发音中找出说话 人之间的个性差异,它涉及到说话人发音器官上的个性差异、发音通道之间的个性差异、发 音习惯之间的个性差异等不同级别上的差异。说话人识别是交叉运用心理学、生理学、语音 信号处理、模式识别、统计学习理论和人工智能的综合性研究课题。 说话人识别根据实现的任务不同,可分为说话人辨认(Speaker Identification)和说话人确 认(Speaker Verification)两种类型[2]。说话人识别根据系统对待识别语音内容的不同,又可 [3] 分为与文本有关(text-dependent)和与文本无关(text-independent)两种方式 。 2.说话人识别的基本理论与前期处理 [4] 2.1 语音产生模型 [4] 语音信号可以看成是激励信号U n 经过一个线性系统H (z ) 而产生的输出 。其中, G ( ) 声道模型H (z ) 为离散时域的声道传输函数,通常可以用全极点函数来近似。不同的说话人 其声道形状是不同的,因此具有不同的声道模型。H (z ) 的表达式为: 1 1 H (z ) A(z ) p −i 1− a z ∑ i i 1 式中p 为全极点滤波器的阶数,a (i 1,2,..., p) 为滤波器的系数。p 值越大,则模型 i 的传输函数和实际声道的传输函数的吻合程度就越高。当然p 值也不能取得太大,一般情 [4] 况下,p 取 8~12 。 2.2 说话人识别基本原理 图 1 给出了说话人识别系统框图。和语音识别系统一样,建立和应用这一系统可以分为 两个阶段,即训练阶段和识别阶段。在训练阶段,系统的每个使用者说出若干训练语句,系 统据此建立每个使用者的模板或模型参量参考集。而在识别阶段,待识别说话人语音中导出 - 1 -

文档评论(0)

wulf + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档