- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号基本分析算法 概述 根据参数性质的不同,语音信号分析分类: 时域分析 频域分析 倒频域分析 线性预测分析 概述 语音信号分析结构框图 数字化过程由声卡完成 预处理和特征分析是需要仿真实验完成 预处理 预加重 高通滤波器: 加窗 汉明窗、汉宁窗 分帧 10~40ms,针对8kHz的采样,一般而言,帧长为80~320个采样点 帧移为半帧长度,即40~160个采样点 概述 概述 提取特征参数 时域:短时能量、短时过零率 频域:短时傅里叶变换、倒谱、MFCC倒谱、LPC谱 估计共振峰(频谱结构) LPC谱分析 带通滤波器组 估计基音周期(分帧进行) 基于互相关函数的方法 基于中心削波后进行互相关函数估计基音周期 基于LPC分析后残差信号互相关函数的方法 基于简化逆滤波器的残差信号互相关函数估计基音周期 概述 原始信号 选取合适的语音段 自相关计算 直接自相关法基音提取 原始信号 三电平削波 取信号绝对值的最大值 选取合适的语音段 自相关计算 中心削波的自相关法基音提取 概述 概述 简化逆滤波法 设计截止频率为900Hz的切比雪夫2型低通滤波器 内插1:5 LPC逆滤波 求线性预测系数 降低取样率5:1 将信号通过低通滤波器处理 残差信号自相关计算 LPC 逆滤波法 语音信号分帧 LPC逆滤波 求线性预测系数 残差信号自相关计算 语音信号分析的作业主要是完成语音信号分析的基本处理过程,掌握和熟悉语音信号的预处理和特征参数提取,为后面的语音信号应用过程奠定基础。 主要任务: 提取时域特征参数,同时比较不同语音段时域特征参数的区别和特点,不同语音分类如浊音、清音的时域特征参数区别。 提取频域特征参数,同时比较不同语音段对应频谱差异,如浊音、清音。 任务要求 估计基音周期,同时比较不同性别语音、不同语种语音的基音周期参数区别,如男声、女声,汉语、英语。 估计共振峰,比较不同语音段共振峰谱结构的区别 任务要求 根据自愿原则进行分组。根据各个班级的选课人数,现将各班分组个数列出: 任务要求 班级选课人数(57人) 分组个数:12组 040110:14人 3组 040111:13人 3组 040112:11人 2组 040113:19人 4组 分组完成以上实验和分析,分析结果以表格或者图示的形式给出,这样更为直观。 实验完成后,每组完成一份实验报告ppt,分组讨论时由每组派一个学生介绍本组的实验过程和结果分析,给出相应的结论。 分组讨论时,各组介绍完各自工作后,其他组或者老师有什么问题,自由提问和回答。 每次研讨之前请将各组的实验报告和任务安排名单发至邮箱:Linchou@。 由于组较多,因此研讨课随机选择组进行汇报,但每次实验每组都必须提交实验报告。 任务要求 实验由MATLAB程序实现,在提供的.m程序基础上,修改或者改进相应的参数,完成相应的分析过程。 注意的问题: 在运行程序时,工具箱voicebox的所有文件和文件夹必须加载到当前目录。 程序中对应的参数,如帧号、文件名称必须根据各自的目录进行修改。 语音信号分析MATLAB程序结构 时域分析:主要指短时能量、过零率和自相关函数 语音信号分析MATLAB程序结构 语音信号分析MATLAB程序结构 频域分析:LPC系数、LPC谱、倒谱系数 语音信号分析MATLAB程序结构 语音信号分析MATLAB程序结构 计算倒谱函数:function cep = melcep(x,fs,w,p,n,fl,fh) 包括两部分功能 计算美尔倒谱 cep = melceps(x,fs,w,nc,p,n,inc,fl,fh); 计算计算倒谱 % f=fft(x); % pw=abs(f); % y=log(pw); % cep=real(ifft(y)); 语音信号分析MATLAB程序结构 fs=8000;w=d;nc=20;p=20;inc=n/2;fl=0;fh=0.5; cep = melceps(x,fs,w,nc,p,n,inc,fl,fh);%求噪声的特征参数 x: 需要分析的语音信号帧 fs:采样率 w:MFCC系数的求解特征,‘d’表示包括倒谱差值 nc: 倒谱系数的阶数 p: 滤波器的个数 n:一帧信号的长度 inc: 帧移,通常为1/2帧长 Fl:求解MFCC系数时包含的最低频率 Fh:求解MFCC系数时包含的最高频率 语音信号分析MATLAB程序结构 语音信号分析MATLAB程序结构 * *
文档评论(0)