语音识别实验报告.pdfVIP

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

语音识别实验报告--第1页

文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

语音识别实验报告

篇一:语音识别报告

“启动”的时域波形

1、语音预加重:

由于语音信号在高频部分衰减,在进行频谱分析时,频

率越高,所占的成分越小,进行语音预加重,可以提升语音

高频部分,使频谱变得平坦,以方便进行频谱的分析和处理。

通常的措施是采用数字滤波器进行预加重,传递函数是:

H(z)?1??z?1,其中?一般去0.92-0.98之间,所以在计算的

时候取0.9375。

预加重后的波形

2、分帧加窗

语音信号具有较强的时变特性,其特性是随时间变化的,

但是语音的形成过程与发音器官的运动有关,这种物理运动

比起声音振动的速度十分缓慢,在较短的时间内,语音信号

的特征可以被认为是保持不变的,通常对语音处理是通过截

取语音中的一段进行处理的,并且短段之间彼此经常有一些

叠加,这一段语音成为一帧语音,语音段的长度称为帧长,

对每一帧处理的结果可用一组数来表示。一般取帧长为10

—30ms。采样频率是8000Hz,所以取的帧长是256,帧移是

178。分帧之后加汉明窗。

3、端点检测

1文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

语音识别实验报告--第1页

语音识别实验报告--第2页

文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

端点检测从背景噪声中找出语音的开始和终止点。

短时能量就是每帧语音信号振幅的平方和。

En??[s(m)];

m?0N?1

短时能量曲线

短时过零率是每帧内信号通过零点的次数,是信号采样

点符号的变化次数。

1N?1

Zn??sgn[x(m)]?sgn[x(m?1)];

2m?0

“启动”的过零率曲线

在实验室的安静的环境下,依靠短时能量和短时过零率

就可进行语音信号的起止点判断。当背景噪声较小时,没有

语音信号的噪声能量很小,而语音信号的短时能量增大到了

一定数值,可以区分语音信号的开始点和终止点。当背景噪

声较大时,可以用短时平均过零率和短时能量结合来判断。

基于能量一过零率的端点检测一般使用两级判决法,

在开始进行端点检测之前,首先为短时能量和过零率分别确

定两个门限。整个语音信号的端点检测可以分为四段:静音、

过渡音、语音段、结束时的静音段,

(1)如果能量或过零率超越了低门限,就应该开始标

记起点,进入过渡段。在过渡段中,由于参数的数值比较小,

2文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

语音识别实验报告--第2页

语音识别实验报告--第3页

文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

不能确信是否处于真正的语音段,因此只要两个参数的数值

都回落到低门限以下,就将当前状态恢复到静音状态。而如

果在过渡段中两个参数中的任一个超过了高门限,就可以确

信进入语音段了,并标记起始点。

(2)如果当前状态之前处于语音段,而此时两个参数

文档评论(0)

177****1306 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档