语音信号处理 第4版 第4章 语音信号分析 思考题答案.docx

语音信号处理 第4版 第4章 语音信号分析 思考题答案.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第四章语音信号分析思考题答案

短时能量(短时平均幅值)和短时过零率的定义是什么?这两种时域参数的用途有哪些?窗口函数的长度和形状对它们有什么影响?常用的有哪几种窗口?

设加窗分帧处理后得到的第n帧语音信号为xn(m),则其短时能量为短时过零率定义为:

浊音的短时平均幅度最大而短时过零率最低。清音的短时平均幅度居中而短时过零率最高,无声的短时平均幅度最低而短时过零率居中。

一个好的窗函数的标准是:在时域因为是语音波形乘以窗函数,所以要减小时间窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑过渡到零,这样可以使截取出的语音波形缓慢降为零,减小语音帧的截断效应;在频域要有较宽的3dB带宽以及较小的边带最大值。

常用的窗函数有矩形窗和汉明窗。

短时自相关函数和短时平均幅差函数的定义及其用途是什么?在选择窗口函数时应考虑什么问题?

短时自相关函数的定义为:

对于浊音,通过计算其短时自相关函数,找到自相关函数的最大值,则可以检测其基音周期。

计算自相关函数所用的窗口长度与平均能量等情况略有不同。这里,N值至少要大于基音周期的两倍,否则将找不到第一个最大值点。另一方面,N值也要尽可能地小,否则将影响短时性。因此长基音周期要用宽的窗,短基音周期要用窄的窗。

语音信号的短时谱的定义是什么?如何利用FFT求语音信号的短时谱?如何提高短时谱的频率分辨率?如何利用实数序列傅里叶变换的频谱具有的对称性?什么是语音信号的功率谱?为什么在语音信号数字处理中,功率谱具有重要意义?

对第n帧语音信号进行离散时间傅里叶变换,可得到短时谱:

令w=2pik/N,相当于是对上式在频域的取样,可以用FFT来计算。

在语音信号数字处理中,功率谱具有重要意义,在一些语音应用系统中,往往都是利用语音信号的功率谱。

请叙述同态信号处理的基本原理(分解和特征系统)。倒谱的求法及语音信号两个分量的倒谱性质是什么?有哪几种避开相位卷绕的方法?请叙述它们的工作原理。

如图a所示为一卷积同态系统的模型,该系统的输入卷积信号经过系统变换后输出的是一个处理过的卷积信号。这种同态系统可分解为三个子系统,如图b所示,即两个特征子系统(它们只取决于信号的组合规则)和一个线性子系统(它仅取决于处理的要求)。第一个子系统,如图c所示,它完成将卷积性信号转化为加性信号的运算;第二个子系统是一个普通线性系统,满足线性叠加原理,用于对加性信号进行线性变换;第三个子系统是第一个子系统的逆变换,它将加性信号反变换为卷积性信号,如图d所示。图中,符号?、+和·分别表示卷积、加法和乘法运算。

什么是复倒谱?什么是倒谱?已知复倒谱怎样求倒谱?已知倒谱怎样求复倒谱?有什么条件限制?

如何将信号模型转化为模型参数?最常用的是什么模型?什么叫逆逼近和逆滤波器?什么叫线性预测和线性预测方程式以及如何求解它们?

由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。而这组预测系数就反映了语音信号的特性,可以作为语音信号特征参数用于语音识别、语音合成等。

最常用的是线性预测模型。

线性预测中的A(z)成为逆滤波器:

通常用莱文逊—杜宾算法来求解。

什么叫线谱对?它有什么特点?它是如何推导出来的?有什么用途?

线谱对分析也是一种线性预测分析方法,只是它求解的模型参数是“线谱对”。线谱对是频域参数,因而和语音信号谱包络的峰有着更紧密的联系;同时它构成合成滤波器H(z)时容易保证其稳定性,合成语音的数码率也比用格型法求解时要低。

具体推导过程参见教材第72-73页。

什么叫MFCC和LPCMCC?如何求解它们?

MFCC是Mel频率倒谱系数的简称,该分析着眼于人耳的听觉特性,因为,人耳所听到的声音的高低与声音的频率并不呈线性正比关系,而用Mel频率尺度则更符合人耳的听觉特性。具体求解步骤参加教材第65-66页。

LPCCMFC为LPCMel倒谱系数,即通过LPC求解的倒谱系数再转换成符合人听觉特性的Mel尺度,进行非线性变换,从而求出LPCMel倒谱系数

小波分析的意义是什么?有什么特点?

小波变换则针对短时傅里叶变换的缺点,采用了一种面积固定不变但形状不断改变的分析窗口来对非平稳信号进行变换。小波分析采用具有时域局域化特性的小波函数作为基底,无论低频还是高频的局部信号,它都能自动调节时频窗以适应实际分析的需要。小波分析在局部时域分析中具有很强的灵活性,能聚焦到信号时频段的任意细节。因此小波变换具有多分辨分析的特点,其在时频两域都具有表征信号局部特征的能力,是一种时间窗和频率窗都可以改变的时频局部化分析方法。小波变换在低

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档