语音信号处理第4讲剖析.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理第4讲剖析

短时平均幅度差函数 短时自相关函数是语音信号时域分析的重要参量。但是,计算自相关函数的运算量很大,其原因是乘法运算所需要的时间较长。为了避免乘法,一个简单的方法就是利用差值。为此常常采用另一种与自相关函数有类似作用的参量,即短时平均幅度差函数(AMDF)。 平均幅度差函数能够代替自相关函数进行语音分析的原理: 如果信号是完全的周期信号(设周期为Np),则相距为周期的整 数倍的样点上的幅值是相等的,差值为零。 短时平均幅度差函数 短时平均幅度差函数的定义: 对于周期性的语音信号, 也呈周期性,与 相反的是: 在谷点时,对应的 是峰值 平均幅度差函数和自相关函数有密切的关系可由下式表达: 短时平均幅度差函数 语音信号的频域分析就是分析语音信号的频域特征。 从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等, 而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线性预测法等几种。本章介绍的是语音信号的傅里叶分析法。 因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。 利用语音的短时傅里叶变换求语音的短时谱 对第n帧语音信号, 短时傅里叶变换,其定义如下: 可知函数是时间n的离散函数,又是角频率 的连续函数,因此,可以从两个角度解释短时傅里叶变换的含义: (1)标准傅里叶变换 (2)滤波器角度 是窗口函数序列,不同的窗口函数序列,将得到不同的傅里叶变换结果 讨论 (1)当n取固定值时,记 ,标准傅里叶变换为: (2)ω固定不变,记ω=L,相当于一个滤波器 当n取不同值时,窗 沿着 序列滑动 标准的FT 离散的短时傅里叶变换 令 则 在语音信号数字处理中,都是采用 短时傅里叶变换也叫短时谱 特点: (1)时变性:即是角频率的函数也是时间n的函数 (2)周期性:是关于角频率的周期函数,周期为 短时功率谱 功率谱:函数的功率谱=该函数自相关+傅里叶变换 根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之间的关系: 或者: 式中*表示复共轭运算。并且功率谱Sn(ejω)是短时自相关函数Rn(k)的傅里叶变换。 第三章作业: P53: 1,2,4 * * 4.1概述 4.2语音分帧 4.3语音信号的时域分析 4.4语音信号的频域分析 语音信号分析 语音信号处理的前提和基础,只有分析出可表示语音信号特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。 贯穿于语音分析全过程的是“短时分析技术” 语音信号从整体来看其特征及表征其本质特征的参数均是随时间而变化的,所以它是一个非平衡态过程,不能用处理平衡信号的数字信号处理技术对其进行分析处理。 但是在一个短时间范围内(一般认为在10-30ms的短时间内),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。 根据所分析出的参数的性质的不同可以分为: 时域分析、频域分析、倒频域分析,线性预测分析等; 分析方法的不同: 模型分析方法和非模型分析方法 不论是分析怎么样的参数以及彩什么分析方法,在按帧进行语音分析,提取语音参数之前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化、语音信号的端点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术。 4.2 语音分帧 进行过预加重数字滤波处理后,接下来就要进行加窗分帧处理。一般每秒的帧数约为33-100帧,视实际情况而定。分帧虽然可以采用连续分段的方法,但一般要采用如图3-1所示的交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的比值一般取为0-1/2。 分帧是用可移动的有限长度窗口进行加权的方法来实现的,这就是用窗函数ω(n)来乘s(n),从而形成加窗语音信号sω(n)=s(n) ω(n)。 语音分帧 帧长与帧移: 取的点数为帧长,乘以采样周期得帧长时间 两帧间隔为帧移 两帧一定要有重叠,否则有参数突变 在语音信号数字处理中常用的窗函数是矩形窗和汉明窗等,它们的表达式如下(其中N为帧长): 矩形窗: 汉明窗: 语音分帧 1.窗口的形状 虽然,不同的短时分析方法(时域、频域、倒频域分析)以及求取不同的语音特征参数可能对窗函数的要求不尽一样

您可能关注的文档

文档评论(0)

ee88870 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档