- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号浓缩版
画出语音信号的产生模型,简述语音的产生过程。
语音产生过程——空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,形
成语音。
4.语音信号的时域分析方法有那些?
短时能量、短时平均过零率以及短时自相关函数计算
什么是浊音的基音频率(F0)?男性、女性和儿童的F0大致分布在什么范围。
浊音的基音频率(F0):声带张开和闭合一次的时间的倒数。由声带的尺寸、特性和声带
所受张力决定。F0的大小决定了声音的高低,称为音高。 男性的F0大致分布在:60~200Hz,女性和儿童的:200~450Hz
电话语音的采样率为8kHz;纯语音在进行计算机录入在15kHz~20kHz左右;音乐高达44kHz。
9. 如何利用语音信号的时域分析方法进行清、浊判断。
能量分析的依据:是基于语音信号幅度随时间变化。清音段幅度小,其能量集中于高频段;
浊音段幅度较大,其能量集中于低频段。
平均幅度分析的依据:清音段幅度小;浊音段幅度较大
短时平均过零的作用:浊音平均过零率低,集中在低频端;
清音平均过零率高,集中在高频端。
短时自相关函数:浊音语音的自相关函数具有一定的周期性。
清音语音的自相关函数不具有周期性,类似噪声
10 通过对语音信号进行分析,可以提取到那些特征参数(列举出三个以上)。
短时平均能量、短时过零率、短时自相关函数、频谱、三个共振峰频率、线性预测系数、LPC倒谱和Mel倒谱、短时平均幅度
11 人的发音器官包括那些。
肺、气管、喉(包括声带)和声道。
12 傅立叶分析在信号处理中有什么意义(作用)?
可以使信号的某些特征变得很明显,语音信号的频谱具有非常明显的语言学习意义。可以获得重要的语音特征(共振峰频率和带宽等)
15 同态信号处理也称为同态滤波,画出同态滤波中特征系统框图
卷积关系和乘积关系变换为求和关系的分离处理
16 语音合成的分类及特点,目的(让机器说话,达到一定的音质与可懂度)
1、波形合成法
特: 简单小词汇(报站器)
优:合成音质好;
缺:存储空间大
2、参数合成法
特: 可以合成大词汇(字典)
缺:合成音质较差。
规则合成法
特:实现难度较大,如TTS系统(文语转换系统)
优:可以合成无限词汇,存储量小
缺:合成音质效果较差
17画出实现语音信号时频语音增强功能的框图。
18. 什么是语音信号的“短时”处理方法。
语音信号是一种随时间而变化的信号,可能是浊音激励也可能是清音激励,浊音的基音周期以及信号幅度等语音参数,都是随时间变化的,但这种变化是缓慢的,在一段时间内10—30ms,语音信号近似不变,所以,我们把变化的语音信号分成一些相继的短时间段来处理。而每一段时间具有固定的特性,这种方法称为短时处理方法。
19 语音信号短时能量分析的用途
1 区分清音段和浊音段 2 区分声母和韵母3 区分无声和有声的分界(信噪比较高的信号) 4 区分连字的边界 5 用于语音识别
20 短时自相关函数的物理意义,性质,作用。序列经过一个冲激响应为的数字滤波器滤波即得到短时自相关函数。
意义:自相关函数用于研究信号本身,如波形的同步性和周期性。
性质:(1)??对称性 R(k)= R(-k)(2)在k = 0处为最大值。(3)对于确定信号,值R(0)对
应于能量,而对于随机信号,R(0)对应于平均功率
作用:1.区分清/浊音 2.估计浊音语音信号的周期,即估计基音周期。
23 短时傅里叶变换的滤波器的解释。
的另一种解释(带限信号-时域卷积)
当w 看成一个参变量,
就只是n的函数。
24 取样率的基本概
(1)时域取样率的基本概念。在时域内的最小取样率SRt=2B
(2)频域取样率的基本概念。:频域最小取样数即为窗宽 SRf=N。
(3)总取样率的基本概念。
25 从如下语音信号的短时谱中能得到什么信息?
共振峰频率、基因周期、短时能量、短时平均过零率、短时自相关函数
26 倒谱分析的作用
1.区分清/浊音2求浊音的基音周期, 可以得到浊音的激励信号。3得到声道的冲激响应h(n)
28 线性预测的基本思想。
通过使实际语音x(n)和线性预测结果x(n)之间的误差e(n){e(n)=x(n)- x(n)} 在某个准则下达到最小值来决定唯一的一组预测系数ak。
29 线性预测分析如何用于语音编码和语音合成
33 矢量量化器最佳设计的两个条件?
1 最佳划分:对给定的码书,根据最邻近准则,找出所有码书矢量的最佳区域
文档评论(0)