- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验一 语音信号的时域和频域分析
一 、 实验目的
¨ 理解和掌握语音信号的数字化和预处理方法。
¨ 理解短时能量分析 、短时过零分析 、短时相关
分析。
¨ 语音信号的短时傅立叶分析方法。
二 、 实验原理
¨ 语音信号分析可分为时域 、 频域 、 倒谱域等方法。
¨ 贯穿于语音分析全过程的是“短时分析技术 ”。
语音信号特性是随时间而变化的 , 是一个非平稳
的随机过程 。但从另一方面 , 在一个相对短时间范 围内其特性基本保持不变 。对于这种特点是语音信 号处理的一个重要出发点 。 因此我们可以采用平稳 过程的分析处理方法来处理语音。
时域分析
¨ 时域分析是语音分析中最早使用 , 应用范围最
广的一种方法。
¨ 特点:
1 、表示语音信号比较直观 。(语音信号本
身就是时域信号)
2 、 实现简单 、运算量小。
3 、可以得到语音的一些重要参数。
常用短时分析技术
¨ 短时能量
¨ 短时平均幅度
¨ 短时过零率
¨ 短时自相关函数
¨ 短时平均幅度差函数
¨ 短时频谱
¨ 短时功率谱
短时能量分析
¨ 能量分析是基于语音信号能量随时间有相当大
的变化 , 特别是清音段的能量一般比浊音段的 小得多。
¨ 短时分析将语音流分为一段一段来处理 , 每一
段称为一“帧 ”。
¨ 用有限长窗函数进行加权来实现。
不同的窗口选择(形状 、长度) , 将决定短时能量
的特性。
窗口的形状: 窗口有多种形状 , 他们都是中心对称
的。
窗口的长度: 无论什么形状的窗口 , 窗口序列的长
度N将起决定性的作用。
N太大 , 能量随时间变化很小 , 不能反映语音信号的
幅度变化 , 波形的变化细节就看不出来;
N太小 , 滤波器的通带变宽 , 短时能量随时间有剧烈
变化 , 不能得到平滑的能量函数。
¨ 窗口的选择(长度的确定) 又需相对不同的基
音周期来选择 。通常情况下 , 一个语音帧内应 含有1—7个基音周期 。然而不同的人其基音周 期变化范围很大 , 因此窗口宽度(N) 的选择 有一个折衷选择为100—200(即10—20ms持续 时间) 。
短时过零分析
¨ 过零就是信号通过零值。
¨ 考察连续语音信号其时域波形通过时间轴的情
况。
¨ 通过相邻取值改变符号判断是否过零 , 从而计
算过零数。
¨ 单位时间内的过零数称为平均过零数。
¨ 对于窄带信号 , 平均过零数计算比较简单。
例: 有一频率为f0的正弦信号 , 以取样频率fs进
行取样 , 则每个正弦周期内有fs/f0个取样 , 另外, 每个正弦周期有二次过零 , 所以平均过零数为
借助平均过零数及取样频率可精确算出频率。
¨ 对于语音信号序列是宽带信号 , 所以不能简单地用上
面的公式计算频率 。但是 , 可借助短时平均过零数来 得到其频谱的粗略估计。
¨ 语音信号的短时平均过零数定义为
¨ W (n)为窗口序列 , 其作用于短时平均能量一样。
是符号函数,
¨ 式子中
短时平均过零数的实现
¨ 首先对语音信号序列进行成对采样地查对采样
以确定是否发生过零 , 若发生符号变化 , 则表 示有一次过零 , 而后进行一阶差分计算 , 再求 取绝对值 , 最后进行低通滤波。
例: 任选一段语音信号 , 对其进行采样 , 画出采
样以后的时域波形。
[x1,fs]=wavread ( c :\wang .wav ) ; %读取语音信
号
sound (x1,fs) ; %播放语音信号
plot(x1) %做原始语音信号的时域图形
title( 原始语音信号) ;
xlabel ( time ) ;
y label ( windows ) ;
绘制该语音信号短时平均能量
%读入声音文件
[x,fs]=wavread ( c :\wang .wav ) ;
%常数设置
FrameLen = 240 ;
FrameInc = 80 ;
%计算短时能量
amp = sum (abs (enframe (filter ( [1 -0 .9375], 1, x)
FrameLen, FrameInc)), 2) ;
subplot (1,2, 1) ;plot (x) ;title ( 原波形图)
subplot (1,2,2) ;plot (amp) ;title ( 短时平均能量图
当选择不同长度的窗时的短时能量
[x,fs]=wavread ( c :\wang .wav ) ;
FrameLen 1 = 51 ;
FrameLen2 = 101 ;
FrameLen3 = 201 ;
FrameLen4 = 401 ;
FrameInc = 80
原创力文档


文档评论(0)