语音信号处理试卷2参考答案.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE

PAGE1

《语音处理技术》试卷2答案及评分标准

一、填空:(9小题,共20分)

语音发音的最小单位是音素,分为元音和辅音两种类型。

清音语音的短时平均能量比浊音语音小。而浊音语音的平均过零率比清音语音低,清音语音的自相关函数没有(填“有”或者“没有”)周期性。

语音信号生成的数字模型包括激励、声道和辐射三个子模型。

声道的数字模型一般分为级联、并联和混合三种类型。

语音信号数字化后,需要预处理,其中预加重是高通(填“低通”、“带通”或者“高通”)滤波器。

线性预测分析中,声道模型被模拟成一个全极点(填“全零点”、“全极点”或者“零极点”)模型。

列举两种基音周期的估计方法:自相关法、平均幅度差函数法。

语音识别按照讲话人范围,分为特定人识别系统和非特定人识别系统。

已知信号x(n)=x1(n)*x2(n),通过以下三步变换:Z[x(n)、lnX(z)=lnX1(n)+lnX2(n)、Z-1[X?(z)]即可求的其复倒谱。

二、简答题(2小题,共6分)

1.(3分)语音信号是由声门脉冲经过声道滤波得到的信号,倒谱分析经过FFT、对数和IFFT变换后,声门脉冲和声道滤波分离开,而基音周期是声门脉冲的周期性,因此利用分离后的声门脉冲去除了声道的影响,估计基音周期更为准确。

2.(3分)什么是最佳VQ矢量量化器码本设计的两条原则?

第1为最近邻原则,第2为质心原则。

三、问答题(4小题,共24分)

1.1)听觉掩蔽效应是指在一个强信号附近,弱信号将变得不可闻,被淹没掉了(2分);2)同时掩蔽是指同时存在的一个弱信号和一个强信号频率接近时,强信号会提高弱信号的听阀,当弱信号的听阀被升高的一定程度时就会导致这个弱信号变得不可闻(2分);3)当两个声音不同时出现时也存在掩蔽效应,称为短时掩蔽(2分);

2.1)--带通滤波AGCA/D变换PCM编码(4分);2)因为每个人的发音有高有低,所以要把幅度归一化(2分);

3.1)由于语音信号的平均功率谱受声门激励和口鼻辐射的影响,高频端大约在800Hz以上按6dB/倍频程跌落,预加重的目的是提升高频部分,使信号的频谱变得平坦,保持从低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析(3分);

2)预加重可在语音信号数字化时在反混叠滤波器之前进行,也可在语音信号数字化之后,在参数分析之前在计算机里用具有6dB/倍频的提升高频特性的预加重数字滤波器来实现,它一般是一阶的数字滤波器:其中值接近1(3分);

4.将原始语音通过线性预测器后,从理论上预测残差信号不包含声道信息(3分),只包含完整的激励信号,因此对残差信号进行分析可以获得更为精确的基音周期(3分)。

四、综合题(5小题,共50分)

1.1)在利用传统自相关函数计算波形周期时,如果窗长不足够长,包含的周期不足够多,则会给周期计算带来困难。N值至少要大于基音周期的两倍,否则将找不到第一个最大值点(3分);

2)矩型窗(3分);

3)(4分);

2.HMM模型包括隐含变量的马尔科夫过程,和观测变量的随机过程这两个随机过程。(4分)

:模型中状态的有限集合,即模型由几个状态组成。(1分);

:输出的观测值符号的集合,即每个状态对应的可能的观察值数目。(1分);

:状态转移概率的集合。(1分);

:输出观测值概率的集合。(1分);

:系统初始状态概率的集合(1分);

:系统终了状态的集合。(1分);

3.因为样本间具有相关性。(2分)

常用的模型有全极点模型,全零点模型及零极点模型三种(6分)

线性预测(1分)

逆滤波器(1分)

4.第一步:初始化

给出训练VQ码书所需的全部参考矢量X,X的集合用S表示;设定量化级数,失真控制门限,算法最大迭代次数L以及初始码书;设总失真;迭代次数的初始化为m=1(2分)

第二步:迭代

1)根据最近邻准则将S划分成N个子集即

当时,下式成立:

2)计算失真:

3)计算新码字:

4)计算相对失真改进量:,将与失真门限进行比较,。若,则转入6),否则转入5)

5)若则转至6),否则m加1,转至1)

(6分)

第三步:结束,得到最终的训练码书,并输出总失真(2分)

5.预处理包括:数字化过程,如抗混叠滤波器、预加重和端点检测。(3分)

特征参数有:时域参数有短时能量、短时过零率、共振峰、基音周期;频域参数包括线性预测系数、线性预测倒谱系数、MFCC系数等。(3分)

识别方法包括:基于VQ的识别方法、基于HMM的识别方法。(

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档