基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用.kdh.pdfVIP

下载本文档

9
0
约1.76万字
约 4页
2018-05-26 发布于河南
举报
版权申诉

基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用.kdh.pdf

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用.kdh

第28 卷第 10期电子与信息学报 Vol.28No.10 2006 年 10 月 Journal of Electronics Information Technology Oct.2006 基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用张玲华郑宝玉杨震 (南京邮电大学通信与信息工程学院南京 210003) 摘要通过对纯净语音及含噪语音短时谱的分析比较，提出了一种基于基音频率及其谐波结构的新的语音特征参数。实验表明，与传统的倒谱特征相比，新特征对加性白噪声相对较不敏感，在闭集文本无关说话人识别中，新特征可以在加性白高斯噪声环境下提高系统的说话人识别率。关键词说话人识别，短时谱，谐波特征，基音频率中图分类号：TN912.3 文献标识码：A 文章编号：1009-5896(2006)10-1786-04 Robust Feature Based on Speech Harmonic Structure for Speaker Identification Zhang Ling-hua Zheng Bao-yu Yang Zhen (College of Communication and Information Engineering, Nanjing Univ. of Posts Telecomms., Nanjing 210003, China) Abstract An effective and robust speech feature extraction method based on pitch frequency and harmonic structure is proposed by means of short-time spectrum analysis of clear and noisy speech. Experimental results indicate that the new feature is relatively insensitive to Additive White Gaussian Noise (AWGN). Compared to conventional cepstrums, the new feature can give outstanding improvement for closed-set text-independent speaker identification under noisy environments corrupted by AWGN. Key words Speaker identification, Short-time spectrum, Harmonic feature, Pitch frequency 有效的鲁棒特征参数提取方法，取得了较好的效果。近年来 1 引言许多文献[4－6]提出，自动说话人识别系统能够使用高层次声说话人识别系统通常对在特定环境中采集的大量语音学信息，以提高系统的准确度、增强鲁棒性。但这些方法的数据进行训练，识别时系统需要同样的环境以保证好的性分析和运算都较为复杂。能。实用中，由于人声道特征、发音方式随时间变动，特别当前的说话人识别领域依然被使用短时、低层次声学信是电话和移动通信环境下，话带以外说话人信息的丢失，包息(如倒谱特征) 的系统所统治。得到广泛应用的线