清辅音特征分析其在耳语音说话人识别中的应用.pdfVIP

清辅音特征分析其在耳语音说话人识别中的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
清辅音特征分析其在耳语音说话人识别中的应用.pdf

清辅音特征分析及其在耳语音说话人识别中的应用 中文摘要 清辅音特征分析及其在耳语音说话人识别中的应用 中文摘要 耳语发音是人的一种特殊发音方式,与正常发音相比有很大差别。耳语音在人们 的日常生活中应用普遍且起着较为广泛的作用。 耳语发音方式下的说话人识别是一个有意义的课题。耳语音的发音特性决定了耳 语音说话人识别的难度要大于正常音说话人识别。考虑到耳语发音比正常发音变化 大,实验中较难获得充足的耳语音训练数据,本文着手研究一种正常音训练的耳语音 说话人识别系统。由于耳语音有别于正常音,当耳语音说话人识别系统用正常音训练 时,识别性能就会发生急速下降。在这种情况下,如何提高耳语音说话人识别系统的 准确率就很值得探讨与研究。针对以上问题,本文主要做了以下几个方面的工作: 一、针对正常音训练的耳语音说话人识别系统,引入了两种新的特征提取方法: 线性频率倒谱系数(Linear Frequency Cepstral Coefficients, LFCC)和指数频率倒谱系数 (Exponential Frequency Cepstral Coefficients, EFCC) ,这两种特征提取方法都强调了语 音的高频部分。实验证明,在高斯混合通用背景模型(GMM-UBM)下的耳语音说话人 识别系统中,LFCC 和 EFCC 特征要优于传统的美尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)特征,识别率提高了8%左右。 二、通过计算正常音-耳语音、正常音清辅音-耳语音清辅音高斯混合模型 (Gaussian Mixture Model, GMM)之间的KL 散度距离,证明正常音和耳语音相比较, 它们的清辅音成分之间具有更大的相似性。然后提取了耳语音的细节信号系数与近似 信号系数之比(Detail-Approximation Energy Ratio, DAER)作为特征参数用于耳语音的 声韵分割。 三、为了进一步改善正常音训练的耳语音说话人识别系统的性能,本文将清辅音 应用于耳语音说话人识别系统中,得到正常音清辅音训练、耳语音清辅音测试的说话 人识别系统。实验表明,同样在LFCC 特征提取下,相比于正常音训练、耳语音测试 的系统,其识别率提高了28%左右。 关键词:耳语音;说话人识别;清辅音;线性频率倒谱系数;KL 散度 作 者:徐 娟 指导教师:赵鹤鸣 I 英文摘要 清辅音特征分析及其在耳语音说话人识别中的应用 Characteristic Analysis on Unvoiced Consonants and its Application in Whispered Speaker Identification Abstract Whispered speech as a special phonation mode is different from normal speech in phonetics and physiology. With the ever-increased progress in society, whispered speech is widely used in human life, especially in all kinds of identity recognition. Whispered speech, as an auxiliary way of communication beside of neutral speech, could improve the performance o

文档评论(0)

chengben002424 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档