- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于小波包的语音特征提取新算法及其DSP实现-Read
基于小波包的语音特征提取新算法及其DSP实现
王靖琰1
(1. 中国科学院上海应用物理研究所,上海201800)
摘要:论文研究了小波包变换,分析了MFCC参数的提取,比较了MEL 滤波器组频带划分和小波包分解的频带划分,提出了基于小波包变换的特征参数(WPDC)。在此基础上,建立了一个矢量量化说话人识别系统。实验结果表明通过小波包变换提取的语音特征参数WPDC优于通过傅立叶变换提取的特征参数MFCC。最后在在浮点型DSP TMS320C6713B上实现了语音信号的WPDC提取。
关键词:说话人识别;MFCC;小波包;矢量量化;DSP
中国分类号:TH873.7 文献标识码:A
A New Speech Feature Extraction Algorithm Based on Wavelet Packet and Its Implement on DSP
Wang Jingyan1
??? (1.Shanghai Institute of Applied Physics, Chinese Academy of Sciences, Shanghai 201800, China)
Abstract: This paper studies wavelet packet transform and analyzes the extraction of MFCC parameters. Comparing partition of frequency-band between MEL filter group and wavelet packet decomposition, we extract a new parameter, WPDC, based on wavelet packet transform. A speaker recognition system is built based on this parameter. The experiment results indicate that the WPDC parameter is outperform MFCC.At last, this anthem is implemented on floating DSP TMS320C6713B.
Keywords: speaker recognition, MFCC, wavelet packet, VQ, DSP
0 引言Factual的关系可由公式(1)
表示:
MFCC 定义为语音信号经过快速傅里叶变换后所得的加窗短时信号的实倒谱。一般MFCC的计算过程如图1所示。
1.2 新特征参数WPDC的提取
现代小波变换被称为数学的显微镜[3],它通过有限个基函数在尺度-频率域上对信号进行分析,在控制分辨率的同时,保留了时域信息,因此在时变信号的处理上受到了极大关注。并且小波变换在各分析频段的恒Q(品质因数)特性与人耳听觉对信号的加工特点相一致,这一良好的特性为利用小波变换提取语音特征参数奠定了基础。
小波变换中的多分辨分析其最终目的是力求构造一个在频率上高度逼近L2(R) 空间的正交小波基,这些频率和分辨率不同的正交小波基相当于带宽各异的带通滤波器。小波包分析就是在多分辨分析的基础上,对高频信号部分进一步分解,这样根据被分析信号的特性,从而提取感兴趣频带的信息,为信号提供了一种更为精细的分析方法。
MFCC 参数提取过程是把信号的频谱通过一系列的带通滤波器,求得每个滤波器输出的对数能量,再进行DCT 变换得到的。从滤波器的角度看,小波包分析就是信号通过一系列不同频带范围的带通滤波器,从而获得信号在各频带内的信息。MEL 滤波器组与小波包分析的作用在某种意义上可以互换,一种很自然的想法就是用小波包分析来代替FFT 与MEL 滤波器组,然后再进行DCT 变换,从而得到一组新的语音特征参数WPDC(Wavelet Package DCT Coefficient)。
由于人耳对语音信号的感知是非线性的,MEL滤波器组在频带上的分布及带宽类似于临界频带的划分,这对选取小波包分析后的结点频带具有指导意义。因此,信号在经过小波包分析后,应选取出与MEL 滤波器组频带相一致的范围内的小波包系数。新的特征参数的提取计算可由图2表示。
笔者对语音信号的采样频率为8000Hz,即最高
语音频率约为4000Hz,根据临界带的划分与MEL滤波器组在频带上的分布,选取24个小波包分析结点频带进行6层小波包分解。小波包分解树中结点及其频带的选取如表1所示。
表1 小波包分解节点选取
小波包节点 频率范围/Hz 中心频率/Hz [6,0] 0~86 43 [6,1] 86~172 129 [6,2
您可能关注的文档
- 基于IDL的遥感影像缨帽变换融合-安徽农业科学.PDF
- 基于Keren改进配准算法的IBP超分率重建-厦门大学学报自然科学版.PDF
- 基于REV尺度格子Boltzmann方法的页岩气流动数值模拟.PDF
- 基于ε-Voronoi图的矢量数据自适应简化方法.PDF
- 基于三维特征空间的土壤盐渍化遥感模型.PDF
- 基于三角模的模糊联想记4网络-计算机研究与发展.PDF
- 基于体素的fMRI数据分类研究及其应用-计算机应用与软件.PDF
- 基于几何方法对太阳影子定位的研究-河北北方学院学报编辑部.PDF
- 基于卡车加载和差分曲率的简支梁桥预警新指标力学与实践.PDF
- 基于卡口车辆外形特征的模糊匹配搜索-博雅华录.DOC
- 基于小波过零点位置不等长编码匹配的虹膜识别-光学精密工程.PDF
- 基于投入产出理论的京生产性服务业发展比较研究.PDF
- 基于控制回路的断路器永磁机构故障特征提取方法-高压电器.PDF
- 基于改进White方法的地下水蒸散发研究-地质通报.PDF
- 基于数字天顶仪的双轴倾角仪研究-光子学报.PDF
- 基于改进相位相关与特征点;准的多图ab算法 - 计算机科学.PDF
- 基于数据融合的行树与篱笆三维信息自动提取-武汉大学学报·信息.PDF
- 基于昆山的江南水乡文化课程基地建设方案-江苏昆山中学.DOC
- 基于星点图像的小像差复原.PDF
- 基于时序HJ ̄CCD影像的区域尺度水稻提取方法-南京农业大学学报.PDF
最近下载
- 抽水蓄能电站工程质量验收评定标准(报批).doc VIP
- 内部审核检查表(GMPC&ISO22716).xls VIP
- 旅游产业智慧旅游目的地建设与管理规划.doc VIP
- ERAS理念在胃癌围手术期护理应用.pptx VIP
- 2022年第四季度电网工程主要设备材料信息价.docx VIP
- 部编版道德与法治五年级上册全册教案 (一).pdf VIP
- 高速公路路基施工中软基的处理技术探究.pptx VIP
- 最新部编人教版小学4四年级语文上册(全册)完整教案【新版】 .pdf VIP
- 成套电气计件工时核算规定样本.docx VIP
- 江苏省南京市联合体2024--2025学年上学期九年级数学月考试卷[含答案].pdf VIP
文档评论(0)