- 3
- 0
- 约4.17千字
- 约 7页
- 2018-04-07 发布于北京
- 举报
基于基音周期的语音MFCC参数提取
摘要:提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无关的说话人确认实验,验证了该方法能有效提高说话人确认的识别率,并能提高短时语音的稳定性。
关键词:说话人识别;基音周期;MFCC参数;频谱距离
中图分类号: TP192.3
文献标识码:A
0引言??
在说话人识别研究中,由于语音的特征参数能有效地体现说话人语音所包含的与其他说话人不同的特点,为此,它在整个识别过程中起着至关重要的作用。目前,在说话人识别研究领域使用较多的有Mel频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、线性倒谱对(LSP)等。其中,MFCC参数是由Davis 和Mermelstein提出[1],主要描述的是语音信号在频率域上的能量分布,由于它能较好地模拟人耳听觉系统的感知能力。所以,多年来一直被说话人识别和语音识别研究人员作为一个重要的特征参数。但传统MFCC参数的提取存在两个不足:(1)它是在语音信号为短时稳定假设前提下进行的,也即是在10~30ms时间内,认为语音信号是近似稳定的[2]。但实际语音信号尽管可以看作短时近似稳定的,但仍然存
您可能关注的文档
- 顾雏军:资本狂人的末路.doc
- 顾客的投诉是一面镜子.doc
- 顾全局PS3忍痛降价 索尼有望赢取DVD制式之争.doc
- 关机为何“偷梁换柱”.doc
- 关系就是生产力 CIO应培养身边的CXO盟友.doc
- 关中大侠布下权限迷宫 慕容小复闯关巧夺特权.doc
- 关注第五媒体:短信.doc
- 关注杀毒软件市场的3大变量.doc
- 官方例子库,走向高手之路.doc
- 官司惹祸 Google-维亚康姆诉讼成就雅虎广告大单.doc
- 2026年房屋租赁合同违约责任分析.docx
- 2025-2026学年小学英语三年级下鲁科版(五四制)(2024)教学设计合集.docx
- 2026年噬菌体疗法五年创新:抗生素替代与细菌感染治疗评估[001].docx
- 跨境电商2026年十年增长:全球供应链与本地化报告.docx
- 基于人工智能的教育资源迭代更新与教学资源个性化定制研究教学研究课题报告.docx
- 初中化学实验安全管理系统与虚拟仿真结合课题报告教学研究课题报告.docx
- 虚拟现实技术在数字教育资源评估与反馈中的应用研究教学研究课题报告.docx
- 初中地理教学中VR技术与地貌观察的课题报告教学研究课题报告.docx
- 初中英语演讲中肢体语言在跨学科教学中的应用研究教学研究课题报告[001].docx
- 校园图书馆借阅行为数据驱动的服务创新研究课题报告教学研究课题报告.docx
最近下载
- AutoCAD2022实用教程全套完整教学课件.pptx
- Soundcraft声艺Signature 22MTK Outline Dimensions file)说明书用户手册.pdf
- 教案课件-典五典范英语5a l6教学参考.pdf VIP
- 商业银行数字化转型:文献综述与研究展望_刘敏楼.pdf VIP
- 施工现场临时用电配电箱标准化图集.pdf VIP
- 施工现场临时用电配电箱(柜)图集.docx VIP
- Electric海菲克功率单元PU00 PU01操作手册.pdf
- 肩周炎诊断及治疗指南.docx VIP
- 电气控制与PLC应用——基于S7-1200_PLC(陈建明)课后习题答案解析.docx VIP
- 腰椎间盘突出症诊疗指南.docx VIP
原创力文档

文档评论(0)