文本无关说话人识别人类听觉模型研究.pdfVIP

文本无关说话人识别人类听觉模型研究.pdf

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文本无关说话人识别的人类听觉模型研究 文本无关说话人识别的人类听觉模型研究 罗海风,龙长才,张冰 (华中科技大学物理学院,武汉,430074) The model of human auditory system in text-independent speaker recognition task Luo Hai-Feng, Long Zhang-Cai and Zhang Bing Department of Physics, Huazhong University of Science and Technology Wuhan, Luoyu Road 1037, 430074, P. R. China 1 引 言1 室中录制完成。每个录音人发音包括:元音串/a o e i u/,10 个自然语句(从流行书籍中随机选取)和 10 自动说话人识别指的是依据语音信号特征建立 个非自然语句。非自然语句是依据自然语句文本内 模型,使之能够自动识别出说话人的技术,具有极 容进行改动,用较生僻词汇代替原有常用词汇,使 其广泛的应用。说话人识别的研究最早可以追溯到 得各元音在自然语句中出现概率反转,高概率变成 上个世纪六十年代,经历了几十年的发展,文本相 低概率,低概率变为高概率。两种类型语句中元音 关的说话人识别已经得到了较好的解决,而不限定 发音概率见表 1。录音后利用Cool Edit Pro 2.1 将元 语音文本内容的文本无关说话人识别是现阶段研究 音串按照自然发音概率高低分离为两组:/i a e/和/e 关注的热点[1] 。当前文本无关说话人识别系统在良 u o/ ,同时所有发音调整至相同平均声强级。 好环境中的识别能力已经能够比人类更加优秀,但 表 1.自然/非自然语句中元音发音概率(%) 是自然环境中有很多因素会严重影响其效果,如复 Table 1. The pronunciation appearance probabilities of vowels in 杂干扰噪声和训练样本的缺乏。相对而言,人类听 natural sentences and unnatural sentences (%). 觉系统在鲁棒性和快速适应能力方面仍有明显优势 /i/ /a/ /e/ /u/ /o/ [2] 。由于对于短时语音特征的研究已经较为深入, 自然语 当前主流的自动说话人识别模型也大多是基于短时 46.9 29.1 25.9 24.8 20.6 句 特征的统计模型,如典型的GMM ,SVM等。虽然 长时语音特征在人类听觉系统中的作用有所研究, 非自然 23.7 22.7 30.7 32.1 25.5 但是其深入机制尚不明了[3] ,这也限制了这些信息 语句 在识别模型中的应用。在本论文中,基于priming效 应[4]设计心理声学实验,研究了人类在处理文本无 2.2 实验者 关说话人认证任务时,如何

您可能关注的文档

文档评论(0)

july77 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档