网站大量收购独家精品文档,联系QQ:2885784924

计算机处理方法(二).pptVIP

  1. 1、本文档共114页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机处理方法(二)

第2章:语音信号的时域、频域特性和短时分析技术 语音信号是一个非稳态的、时变的信号。而由于声道、即人的口腔肌肉运动是缓慢的,所以在“短时间”范围内可以认为是稳态的,时不变的。这个短时间一般指10~30ms。由于这个特性,故常把语音信号称为“准稳态”信号。这种短时分析方法称为“短时分析技术”。 语音分帧 在短时分析中,将语音信号分为一段一段地来分析其特征参数,其中一段称为一“帧”,一帧长一般取10~30ms。这样,对于整体的语音信号来讲,每一帧特征参数组成了特征参数时间序列。 声音录音过程(1)第一步,进入XP系统,打开播放器,并打开录音机 声音录音过程(2)第二步,设置录制文件属性 声音录音过程(3)设置采样频率,采样位数,单声道 声音录音过程(4)例如选择8000Hz,16位,单声道 声音录音过程(5)将电脑耳机输出端与麦克风输入端用音频线相连,打开播放器播放音乐,电脑放音音量调整最大音的1/6,按下录音键 声音录音过程(6)例如要录制5.5秒,当显示5.5秒时,按下停止键 声音录音过程(7)保存到相关目录下(文件类型默认.wav)(文件名:英文) 课堂练习: (1)在XP系统中录制一段系统音乐,录制时间3秒,采样频率:8000Hz,采样位数:16位,单声道 2.1MATLAB中的语音信号分帧 语音信号(音频文件,格式.wav)的读入函数: 2.1MATLAB中的语音信号分帧 语音信号的播放函数 名称:sound 功能:播放函数 调用格式:sound(Y,FS) 说明:采样频率为FS的Y数据以声音形式播放。 调用格式:sound(Y) 说明:采样频率为8192Hz的Y数据以声音形式播放。 调用格式:sound(Y,FS,BITS) 说明:采样频率为FS,数据位数为BITS的Y数据以声音形式播放。 读入bluesky3.wav文件到数组Y1,redriver.wav文件到数组Y2,并查看信息 查看波形: 课堂练习 用wavread读入刚制作的音频文件,读出FS及bits的值,用size指令分析其数组Y大小,用plot指令画出其波形。 思考:如果音量太大,会出现什么情况? 2.1MATLAB中的语音信号分帧 窗函数 名称:window 功能:窗函数 调用格式: WINDOW(@WNAME,N) 说明:输出窗长为N,窗函数名称为WNAME的数组。 矩形窗调用格式: WINDOW(@rectwin,N) 说明:输出窗长为N,矩形窗的数组。 海宁窗调用格式: WINDOW(@hann ,N) 说明:输出窗长为N,海宁窗的数组。 汉明窗调用格式: WINDOW(@hamming ,N) 说明:输出窗长为N,汉明窗的数组。 用MATLAB画出窗长30点矩形窗、海宁窗、汉明窗波形 课堂练习: 用MATLAB画出窗长40点矩形窗、海宁窗、汉明窗波形 MATLAB画出窗长40点矩形窗、海宁窗、汉明窗频谱 三种窗幅频特性 课堂练习: 画出窗长40点矩形窗、海宁窗、汉明窗幅频特性(N=256) 指令fft(x,N); 为了分析读入数据,通常进行分帧处理。在分帧中,往往设置在相邻两帧之间有一部分重叠。其原因是:语音信号是时变的,在短时范围内特征变化较小,所以作为稳态处理;但超过这短时范围语音信号就有变化了。在相邻两帧之间基音发生了变化,如正好是两个音节之间,或正好是声母向韵母过渡,等等,这时,其特征参数有可能变化较大,但为了使特征参数平滑地变化,在两个不重叠的帧之间插一些帧来提取特征参数,这就形成了相邻帧有重叠部分。 语音信号分帧 分帧子函数:emframe 说明:输入参数x是语音信号;win是帧长或窗函数,若为窗函数,帧长便取窗函数长;inc是帧移。输出参数f为分帧后的数组,将为帧数×帧长。 读入bluesky3.wav文件到数组Y1,redriver.wav文件到数组Y2,以窗长8,帧移3进行分帧 课堂练习 读入刚录制的音频文件文件到数组,以窗长40,帧移6进行分帧,并比较帧之间的数据关系 2.3语音信号短时时域分析 短时能量: 短时平均幅度 前24帧对应时间 语音文件bluesky3.wav(蓝天.白云)短时能量 求红河谷redriver2.wav的短时能量 红河谷redriver2.wav的短时能量 课堂练习:求自录音乐的短时能量 例2-3-12(pr2-3-12),读入语音文件bluesky3.wav(蓝天.白云),分帧后计算短时平均幅度 语音文件bluesky3.wav短时平均幅度图 例2-3-13(pr2-3-13),读入语音文件redriver2..wav,分帧后计算短时平均幅度 redriver2..wav,分帧后短时平均幅度 课堂练习:求语音文件redriver1..wav文件的短时平均幅度 2.3.2 短时

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档