第三章语音信号的短时时域分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章语音信号的短时时域分析 短时平均幅度函数随矩形窗窗长N变化的情况 3.5 短时平均过零率 1. 定义 在离散时间语音信号情况下,如果相邻的采样具有不同的代数符号就称为发生了过零。单位时间内过零的次数就称为过零率。短时平均过零率的定义为 在上式中,用1/2N 作为幅值,是考虑了对该窗口范围内的过零数取平均的意思。 考虑到w(n-m)的非零值范围为n-m≥0,即m≤n,以及 n-m≤N-1,故m≥n-N+1,因此短时平均过零率可以改写为: (定义式) 2. 实现短时平均过零率 女声“我到北京去”的短时平均过零次数的变化曲线: 3. 应用 清音过零率高,浊音过零率低。 局限性:浊音和清音重叠区域只根据短时平均过零率不可能明确地判别清、浊音。 端点检测 端点检测目的:从包含语音的一段信号中确定出语音的起点及结束点。 有效的端点检测不仅能使处理时间减到最少,而且能抑制无声段的噪声干扰,提高语音处理的质量。 3.6 短时自相关分析 3.6.1 短时自相关函数 时域离散确定信号的自相关函数定义为: 时域离散随机信号的自相关函数定义为: 周期为P的周期信号满足: 自相关函数具有下述性质: (1)??? 对称性 R(k)= R(-k) (2)??? 在k = 0处为最大值,即对于所有k来说, |R(k)|≤R(0) (3)??? 对于确定信号,R(0)对应于能量 对于随机信号,R(0)对应于平均功率 数字语音处理及MATLAB仿真 张雪英编著 * 数字语音处理及MATLAB仿真 张雪英编著 * 第三章 语音信号的短时时域分析 3.1 概述 1 3.2 语音信号的预处理 3.3 短时平均能量 3 3.4 短时平均幅度函数 4 3.5 短时平均过零率 5 3.6 短时自相关分析 6 2 3.7 基于能量和过零率的语音端点检测 7 3.1 概述 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中都需要提取语音中包含的各种信息。 语音处理的目的:对语音信号进行分析,提取特征参数,用于后续处理;加工语音信号。 总之,语音信号分析的目的就在于方便有效的提取并表示语音信号所携带的信息。 根据所分析的参数类型,语音信号分析可以分成时域分析和变换域(频域、倒谱域)分析。其中时域分析方法是最简单、最直观的方法,它直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等。 3.2 语音信号的预处理 在对语音信号进行数字处理之前,首先要将模拟语音信号s(t) 离散化为s(n). 实际中获得数字语音的途径一般有两种,正式的和非正式的。 正式的是指大公司或语音研究机构发布的被大家认可的语音数据库,非正式的则是研究者个人用录音软件或硬件电路加麦克风随时随地录制的一些发音或语句。 图3-4 语音信号处理系统框图 语音信号的频率范围通常是300~3400Hz,一般情况下取采样率为8kHz即可。 采样后的信号在进行量化的过程中不可避免的产生量化误差,一般可用量化信噪比来表示量化误差的大小: 3.2.1 语音信号的预加重处理 预加重目的:为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。可通过一阶FIR高通数字滤波器来实现: 设n时刻的语音采样值为x(n) ,经过预加重处理后的结果为 有了语音数据文件后,对语音的预处理包括:预加重、加窗分帧等。 高通滤波器的幅频特性和相频特性如下 预加重前和预加重后的一段语音信号时域波形 预加重前和预加重后的一段语音信号频谱 3.2.2 语音信号的加窗处理 由于

文档评论(0)

锦绣中华 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档