- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语⾳处理⼤作业
信号与系统-MATLAB综合实验之语⾳处理1
⾕源涛应启珩郑君⾥
⼆〇⼀⼀年七⽉⼀⽇
1摘录于草稿,可能和纸质出版物不完全相同。本版本已经更正了勘误表指出的错误。
⽬录
第⼀章语⾳合成1第⼀节背景知识(1)
1.1.1发声机理(1)
1.1.2语⾳信号的时域特征(2)
1.1.3语⾳模型(3)
1.1.4分析和合成语⾳(5)
第⼆节练习题(6)
1.2.1语⾳预测模型(6)
1.2.2语⾳合成模型(9)
1.2.3变速不变调(10)
1.2.4变调不变速(10)
1.2.5逆向⼯程(10)
第⼀章语⾳合成
本章中将基于数字滤波器和z变换等基础知识,应⽤第⼀篇讲授的MATLAB编程技术,在语⾳分析合成领域做⼀些练习。通过
本章的练习,可以增进对z变换和滤波器的理解,熟练运⽤MATLAB基本指令。本章包括两部分,第⼀部分介绍语⾳⽣成和分
析的基本知识,第⼆部分给出详细的练习内容和编程步骤。相信读者对此会产⽣强烈兴趣。
第⼀节背景知识
1.1.1发声机理
从物理原理来看,语⾳信号是由肺挤压出的空⽓激励发声器官振动产⽣的。发声器官包括喉、声道和嘴。喉位于⽓管的上端,
实际上是由⽓管末端的⼀圈软⾻构成的⼀个框架。喉中有两⽚肌⾁,它们和周围的韧带称为声带。声带张开时空⽓可以⾃由地
流过喉和⽓管,如正常呼吸时;声带闭合,将喉封住,所以吃东西时⾷物不会落⼊⽓管。两⽚声带之间的空隙称为声门。说话
时声带相互靠拢但不完全封闭,这样声门变成⼀条窄缝,当⽓流通过时其间压⼒减⼩,从⽽声带完全合拢使⽓流不能通过;在
⽓流被阻断时压⼒恢复正常,因⽽声带间形成空隙,⽓流再次通过。这⼀过程周⽽复始,就形成了⼀串周期性的脉冲⽓流送⼊
声道。如图1.1所⽰。这个脉冲串的周期称为基⾳“周期”,其倒数是基⾳“频率”。男性说话的基⾳频率在60-200Hz范围内,⼥
性和⼩孩在200-450Hz之间。以上
图1.1:典型的声门脉冲串波形
⽓流从喉向上经过⼝腔或者⿐腔后向外辐射,经过的传输通道称为声道。⽓流流过声道犹如通过⼀个具有某种谐振特性的腔
体。如图1.2所⽰。输出⽓流的频率特性既取决于
声门脉冲串的特性,⼜取决于声道特性。声道包括⼝腔和⿐腔两部分,对成年男性⽽⾔,⼝腔段约17cm,⿐腔段约13cm,
⽓流在软腭的控制下分别流向这两个通道。所以声道的截⾯积是变化的,⽽声道的频率特性主要取决于声道截⾯的最⼩值(收
紧点)出现的位
置,除了软腭控制⼀些外,收紧点主要由⾆头的位置来决定。
图1.2:
声管构造⽰意图图1.3:级联⽆损声管模型
语⾳的另⼀种产⽣⽅式是声门完全闭合,此时声道不是受声门周期脉冲⽓流的激励,⽽是利⽤⼝腔内存有的空⽓释放出来⽽发
声。该⽓流在⼝腔中形成湍流,因⽽表现为随机噪声。这种⽅式发出的⾳就是清⾳。(男⽣如果把⼿放在脖⼦前⾯喉结上部的
倒三⾓位置,发浊⾳啊“”的⾳时可以感觉到声管的震动,发清⾳是“”的⾳时就感觉不到。)
1.1.2语⾳信号的时域特征
⼀段⼥声发⾳“MATLAB”的波形如图1.4所⽰,可以看出语⾳能量的起伏从⽽⼤致分辨出话语中的每个⾳节在此波形中的位
置。我们把时间轴拉宽后在图1.5中观察两个细节部分,可以看出语⾳的浊⾳段能量较⼤(右上图),有明显的周期特征,⽽
清⾳段能量很⼩(右下图),类似于噪声随机变化。
图1.4:⼥声发⾳“MATLAB”图1.5:⼥声发⾳“MATLAB”细节
1.1.3语⾳模型
语⾳⽣成模型
通过对声管的研究,发现它可以⽤若⼲段截⾯积不等的均匀管道级联起来描述,如图
1.3,⼀般称作级联⽆损声管模型。采⽤流体⼒学的⽅法可以证明每⼀截均匀管道能够⽤⼀个单极点模型来近似,这样N段管
道组成的声管就可以⽤⼀个N阶全极点滤波器表述,即V(z)=G∏Nk=1(1?pkz?1)=G1?∑Nk=1ak
z?k(1.1)对于典型的男声,N=10,所有的极点pi要分别构成共轭对以保证{ai}系数都是实数。再综合考虑清⾳信号,就可以
得到语⾳信号产⽣的离散语⾳模型,如图1.6所⽰。
图1.6:产⽣语⾳信号的离散时域模型
准确的清浊⾳判决远远超出了本书的范畴,因⽽我们将对上述模型进⾏充分简化。⾸先去掉随机信号激励部分,我们认为激励
信号是⼀个脉冲序列,不考虑有⽆周期。其次去掉声门脉冲模型和⼝唇的辐射模型,从⽽得到图1.7所⽰最简单的语⾳模型,
现在我们⽤z变换的知识就可以应对了。
图1.7:简化的语⾳⽣成模型
假设激励信号⽤e(n)表⽰,语⾳信号⽤s
文档评论(0)