面向说话人识别的非线性频谱变换研究-信号与信息处理专业毕业论文.docxVIP

面向说话人识别的非线性频谱变换研究-信号与信息处理专业毕业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
iIìí向说话人识剔的非线性频谱变换研究中文摘第 iIìí向说话人识剔的非线性频谱变换研究 中文摘第 摘要 说话人识别是通过对说话人的个性特征进行分析和提取来达到确认或辨别说 话人身份的囚的。由于其具备数据来集设备的非接触性、简易性,价格比较低廉, 易被用户接受等优点,是当前语音信号处理研究领域的研究热点之一,具有广泛的 市场应用前景.本文在对现有说话人识别技术进行分析的基础上,重点研究分析了 非线性频谱变换对说话人识别的影响,然后提出…种面向说话人识别的新的非线性 频谱交换方法,讨论了其有效性及不足,并提出了进…步的研究方向. 特征的选择与提取和模型的选取是影响说话人识别性能好坏的关键因素.目前 受到广泛应用的特征参数是反映声道响应特性的倒谱系数,特别是基于人耳听觉特 性的 MFCC 特征参数.1iI.然已经取得了较高的识别率,但是常反映的是语音特征, 而不着囊反映说话人个彼特征.本文首先介绍分析了常用的 1川、 M咱::C 和 MFCC 特征参数的说话人识别系统的性能.然后介绍了 Mel 尺度、 Bark 尺度及 ERB 尺度 这三种非线性频潜变换,分析在不同的训练数据、不同测试时间的条件下,二三种司在 线性频谱交换对应的说话人识别系统的性能. 根据语音信号不同频带携带的个性特征信息量的不间,分析研究各个频带对说 话人识别的贡献,得出每个频带的说话人相对误识率,提升对说话人识别贡献大的 糊带,而降低对说话人识别贡献小的频平静.首先加权改进了Bark非线性频谱变换, 将其应用于说话人识别系统,使得系统的性能得到提高.避而提出…种商向说话人 识别的非线性频谱变换的方法以及特征提取算法. 实验表明,与传统的 Mel、Bark 利也阳谱朝阳性频谱交换栩比,所提出的 非线性频谱变换方法可以有效突出语音中的说话人个性特征,提高特征空间中类别 的可分性.在同样的测试条件下,平均误识率降低歪 0.668%. 在较长测试时问条件 下,误识冻在 臣可以达到 0,有效地提商了说话人识别系统的性能二 关键询s 说话人识别,非线性频谱变换,矢最量化,高斯混合模型 作 者z 袁冬梅 指导老师g 俞…彪 商向说话人 商向说话人识别的非线性频谱变换研究 英文摘哥 Abstract Speakerre∞剧创onisωiden响。r verify who is spe制ngbyanal川略加dividua1 M伽mation extracted from the speakers voice. B阴阳晤。,fiωparticular adv8Btage 侃 convenience,economy and ex棚lSib汹以 itωnbeapp航时 inma画I.Y fiel也 such as security ωntrol,electronic bank, mili阳y and forensics. This thesis anal归es tbe contribution of some existed no卧linear s严由um ttansfonnationω 酬咄:er recognition, and 萨吨lOSeS a newnon-OOωr 咿圳um 阳IlllStlωmatiω. F,刷刷re selection,翩翩。lJland 咿创阳 m叫eOOg 脚 key tecbniquωωs阳k缸 ∞伊ition syste皿 Now 伽 cep销对 αlefficients wbich retlect 加 vocal res归nse lIlC widely used 旭 speaker 伊ition,郎pecially 伽 Mel 货明uea叮创pstralωefficièn也 协cause of its acoustic 阳ceptive charac阳isti仰.Al也ough it acbievωbe阳附u1邸, it only represenω 加 speech infonnati棚 but not eJ呻怕翩棚 8pc咄衍s indivih隔I M伽m剧佩 τh 萨嚣formanωof LPC,LPCC and MFCC is 位富t evaluated. 四m 阳 performanωof three no且-00倒r sμctn皿 transfonnation, Mel scale,Bark scale and ERB 民ale ftequency 衍IlllSfonnation are ∞mpared for differ翩翩t time and train data. 四e contribution of 侃ch 问,uency bandω 聊a阳∞gnition is 棚aly时 也倒d

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档