哈尔滨工程大学语音信号处理实验报告资料.docVIP

哈尔滨工程大学语音信号处理实验报告资料.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验报告 实验课程名称: 语音信号处理实验 姓名: 班级:学号: 实验序号 实验名称 实验过程 实验结果 实验成绩 实验一 语音信号的端点检测 实验二 语音信号的特征提取 实验三 语音信号的基频提取 指导教师 张磊 实验教室 21B#293 实验时间 2015 年 4月 12日 实验成绩 实验一 语音信号的端点检测 一、实验目的 1、掌握短时能量的求解方法 2、掌握短时平均过零率的求解方法 3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。 二、实验设备 HP计算机、 Matlab软件 三、实验原理 1、短时能量 语音信号的短时能量分析给出了反应这些幅度变化的一个合适的描述方法。 对于信号 { x(n)} ,短时能量的定义如下: En  [ x(m) w(n  m)] 2  x2 ( m) h(n  m)  x 2 ( n)  h(n) m  m 2、短时平均过零率 短时平均过零率是指每帧内信号通过零值的次数。 对于连续语音信号, 可以考察其时域波形通过时间轴的情况。 对于离散信号, 实质上就是信号采样点符号变化的次数。过零率在一定程度上可以反映出频率的信息。 短时平均过零率的公式为: Zn 1 sgn[x(m)] sgn[x(m 1)] w(n m) 2 m 1 n N 1 sgn[xw (m 1)] 2 m n sgn[xw (m)] 其中, sgn[.] 是符号函数,即 1 x( n) 0 sgn[x(n)] 1 x( n) 0 3、端点检测原理 能够实现这些判决的依据在于, 不同性质语音的各种短时参数具有不同的概 率密度函数, 以及相邻的若干帧语音应具有一致的语音特性, 它们不会在 S、U、 V 之间随机地跳来跳去。 要正确判断每个输入语音的起点和终点, 利用短时平均幅度参数 E 和短时平均过零率 Z 可以做到这一点。 首先,根据浊音情况下的短时能量参数的概率密度函数  P( E |V ) 确定一个阈 值参数  EH  , EH  值一般定的较高。当一帧输入信号的短时平均幅度参数超过  EH 时,就可以判定该帧语音信号不是无声,而有相当大的可能是浊音。根据  EH 可 判定输入语音的前后两个点 A1 和 A2 。在 A1 和 A2 之间的部分肯定是语音段,但语音的精确起点、终点还要在 A1 之前和 A2 之后仔细查找,如图 1 所示。 E E H E L C1 B1 A1 A2 B2 C2 Z Z s C 1  B1  A1  A 2  B 2  C2 图  1  端点检测原理示意图 为此,再设定一个较低的阈值参数 EL ,由 A1 点向前找,当短时能量由大到 小减至 EL 可以确定点 B1 。类似地,可以由 A2 点向后找,确定 B2 点。在 B1 和 B2 之间的仍能肯定是语音段。然后由  B1 向前和  B2 向后,利用短时平均过零率进行 搜索。根据无声情况下的短时平均过零率,设置一个参数 Z s ,如果由 B1 向前搜 索时,短时平均过零率大于 Zs 的 3 倍,则认为这些信号仍属于语音段,直到短 时平均过零率下降到低于 3 倍的 Z s ,这时的点 C1 就是语音的精确的起点。对于 终点也做类似的处理,可以确定终点  C2 。采用短时平均过零率的原因在于,  B1 点以前可能是一段清辅音,它的能量相当弱,依靠能量不可能将它们与无声段分开。而对于清辅音来说,它们的过零率明显高于无声段,因而能用这个参数将二者区分开来。 存在噪声的情况下, 正常的过零率计算会存在一定的误差, 解决这个问题的一种方法是对上述过零率定义做一个简单的修改, 即设立一个门限 T,将过零率的含义修改为跨过正负门限的次数,如图 2。 门限 3 门限 2 门限 1 门限 1 时间 门限 2 门限 3 图 2 门限短时平均过零率 于是,有: Zn 1 T ] sgn[x(m 1) T ] { sgn[x(m) 2 m sgn[x( m) T ] sgn[x(m 1) T ] } w( n m) 这样计算的短时平均过零率就有一定的抗干扰能力。即使存在小的随机噪声,只要它不超过正负门限所构成的带,就不会产生虚假过零率。 四、实验步骤及程序 实验程序: function point_check() s1=wavread(man.wav); s=s1/max(abs(s1)); s=filter([1 -0.9375],1,s); plot(s); len=length(s); round=160; repeat=80; inc=round-repeat;%b_len-2*repeat; ka=ceil((len-round)/(rou

文档评论(0)

158****3214 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档