共振峰瞬时频率特征用于说话人识别.pdfVIP

共振峰瞬时频率特征用于说话人识别.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
共振峰瞬时频率特征用于说话人识别.pdf

共振峰瞬时频率特征用于说话人识别 侯丽敏、谢娟敏 摘要:本文提出了一种新的共振峰瞬时特 识别而言,共振峰频率的精确值无疑是一个 征(formant instantaneous characteristics ,FIC) 有利信息。 的提取方法并用于说话人识别。Hilbert- 本文提出一种利用Hilber-Huang 变换提 Huang 变换(HHT)是分析非平稳信号的有力 取共振峰精细特征的方法,将其用于基于 工具,利用 HHT 分析语音信号共振峰处的 GMM 的说话人识别系统中。应用语音的调 [5] 时变信息,提取FIC 参数。由于共振峰瞬 幅 和 调 频 AM-FM 模 型 , 时频率反映了说话人的声道个性特点及声 t s (t) a(t) cos(t) a(t) cos[2 f ()d] ,  道与声门作用的结果,与传统的方法比 0 较,本文提出的方法可以更准确地描述共 用 Hilbert 变换(HT)[6] 或希尔伯特黄变换 振峰瞬时频率。本文的 FIC 与 MFCC 构成 (HHT)[7] ,得到其瞬时频率和瞬时幅度。兼 组合参数,应用在基于高斯混合模型 顾共振峰包含大量语音信息的考虑,我们提 (GMM)的说话人识别系统中进行实验,正 取的信息主要为前三个共振峰处的瞬时信息 确识别率可提高 11.96%。实验结果说明共 [8],经过不同的参数抽取方法,得到不同 振峰的瞬时频率对语音信号的幅度频谱有 种类的共振峰参数,统称其为共振峰瞬时特 征 (Formant Instantaneous Characteristics, 补偿作用。 FIC) 。结果表明:整体上FIC 是有效的说话 关键词: 说话人识别 共振峰 瞬时频率 人识别参数。FIC 的加入对用于说话人识别 的 MFCC 来言,从相位角度起到了补偿作 1. 引言 用,提高识别率可以达到11.96%。 说话人识别是研究语音信号包含说话人 信息的语音研究重要分支,在过去的几十年 2. 共振峰频率和带宽的调制 里,学者们对它进行了深入的研究。研究表 根据对语音 AM-FM 模型的研究,得 明 Mel 倒谱系数(Mel-frequency Cepstral Coefficient,MFCC)[1,2]对说话人识别来言是 知:语音中不仅存在共振峰频率的调制,也 存在共振峰带宽的调制。这里,通过气流通 一种性能较好的特征参数。它是一种在与人

您可能关注的文档

文档评论(0)

phljianjian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档