文本无关说话人识别人类听觉模型研究.pdfVIP

下载本文档

5
0
约7千字
约 2页
2017-08-10 发布于安徽
举报
版权申诉

文本无关说话人识别人类听觉模型研究.pdf

1、本文档共2页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

文本无关说话人识别的人类听觉模型研究文本无关说话人识别的人类听觉模型研究罗海风，龙长才，张冰（华中科技大学物理学院，武汉，430074） The model of human auditory system in text-independent speaker recognition task Luo Hai-Feng, Long Zhang-Cai and Zhang Bing Department of Physics, Huazhong University of Science and Technology Wuhan, Luoyu Road 1037, 430074, P. R. China 1 引言1 室中录制完成。每个录音人发音包括：元音串/a o e i u/,10 个自然语句（从流行书籍中随机选取）和 10 自动说话人识别指的是依据语音信号特征建立个非自然语句。非自然语句是依据自然语句文本内模型，使之能够自动识别出说话人的技术，具有极容进行改动，用较生僻词汇代替原有常用词汇，使其广泛的应用。说话人识别的研究最早可以追溯到得各元音在自然语句中出现概率反转，高概率变成上个世纪六十年代，经历了几十年的发展，文本相低概率，低概率变为高概率。两种类型语句中元音关的说话人识别已经得到了较好的解决，而不限定发音概率见表 1。录音后利用Cool Edit Pro 2.1 将元语音文本内容的文本无关说话人识别是现阶段研究音串按照自然发音概率高低分离为两组：/i a e/和/e 关注的热点[1] 。当前文本无关说话人识别系统在良 u o/ ，同时所有发音调整至相同平均声强级。好环境中的识别能力已经能够比人类更加优秀，但表 1.自然/非自然语句中元音发音概率（％）是自然环境中有很多因素会严重影响其效果，如复 Table 1. The pronunciation appearance probabilities of vowels in 杂干扰噪声和训练样本的缺乏。相对而言，人类听 natural sentences and unnatural sentences (%). 觉系统在鲁棒性和快速适应能力方面仍有明显优势 /i/ /a/ /e/ /u/ /o/ [2] 。由于对于短时语音特征的研究已经较为深入，自然语当前主流的自动说话人识别模型也大多是基于短时 46.9 29.1 25.9 24.8 20.6 句特征的统计模型，如典型的GMM ，SVM等。虽然长时语音特征在人类听觉系统中的作用有所研究，非自然 23.7 22.7 30.7 32.1 25.5 但是其深入机制尚不明了[3] ，这也限制了这些信息语句在识别模型中的应用。在本论文中，基于priming效应[4]设计心理声学实验，研究了人类在处理文本无 2.2 实验者关说话人认证任务时，如何