第二章-语音信号的声学基础.pptVIP

下载本文档

15
0
约3.88千字
约 32页
2018-03-16 发布于北京
举报
版权申诉

第二章-语音信号的声学基础.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二章-语音信号的声学基础.ppt

第二章语音的声学基础与产生模型 2.1 语音信号的产生肺(lung)与气管(trachea) ------声音产生的能量来源声带(vocal cords),又称为喉(larynx) ------控制气流从气管到口腔的流动，周期性的振动(浊音)或不振动(清音) 声道(vocal tract)：包括咽(pharynx)、口腔（oral cavity)、鼻腔(nasal cavity) ------ 包括舌头、牙齿、软腭、唇等主要发音器官(articulator)；其形状和位置决定了所发的声音；作用类似于声学管道(滤波器)；长度约17cm（成年男子）激励源（Excitation source）肺部产生气流气流通过气管气流受声带的开、关周期振动控制其通过方式声道滤波器（Vocal tract filter）通过发音器官的不同位置与形状对通过声道的气流进行调制某些频率成分的能量被放大，另一些频率成分的能量则被减小辐射（Radiation）经过调制的声音经嘴唇或鼻孔辐射声带周期振动产生周期脉冲激励信号发出浊音：类似音乐声，有基频，如汉语的元音声带不振动，放松状态摩擦形成湍流(turbulence) 发出摩擦音：类似噪声，如汉语的辅音/c/,/s/,/h/等声带放松，舌头和嘴唇先紧闭再突然放开产生短脉冲发出爆破音,如汉语的/b/,/p/,/t/等声道通常被认为是一个截面积随时间和位置而改变的管道。起到类似滤波器的功能，对激励源信号进行滤波多个共振峰(formant):对某一频率的信号产生共鸣(resonance), 对应频谱的波峰基频描述激励源的振动频率；共振峰刻画声道的调制（滤波）。鼻腔耦合产生鼻音能量集中在低频部分和口腔产生的共鸣反应（共振）相反，出现反共鸣(anti-resonance),对应频谱的波谷嘴唇辐射通过改变管道的边界条件（开口或闭口）改变气流的传递方式调音方式(manner of articulation) 控制气流的流动方式区分清音和浊音决定不同类型的语音的产生：元音、半元音、鼻音、卷舌音、爆破音、摩擦音、塞擦音等等调音位置(place of articulation) 主要是通过发音器官位置的改变来控制调音位置例如元音的进一步细分主要是靠舌位的改变来实现对给定的语音信号画对应的语谱图是语音分析的经典方法。虽然目前在语音工程应用上已经很少使用语谱图，但它却是初学者认识语音的最好的工具与分析方法。语谱图通常会分为宽带语谱图和窄带语谱图，从二者可以得到关于语音信号的不同的特征。我们会在第三章介绍语音信号的特征分析时再详细介绍语谱图的产生方法 2.2 语音信号的感知语音信号的感知：听觉系统听觉神经大脑人耳的构造与功能：外耳：声音的收集、定位、放大定位：双耳结构可以实现水平方向的定位；耳翼的不规则结构则可以实现垂直方向的定位放大：外耳道可以看作是一个均匀管道（长25mm），其共振峰频率约为3400Hz。外耳可以实现声音放大约20dB 中耳：声音的传导、放大、保护内耳中耳可以放大声音约30dB 内耳：包含半规管、前庭窗以及耳蜗，其中耳蜗跟听觉密切相关耳蜗根据接收到的声音来相应地刺激听神经，实现机械振动到神经信号的转换耳蜗根据频率选择特性向听神经传递信号耳蜗是听觉系统中最脆弱、最重要的部分。通常，人的左、右耳对声音的感知是不太一样的，这种差异性因人而异人耳的听觉过程示意图 /webcontent/animations/content/soundtransduction.html 人听觉特性： 2.3 语音信号产生的声学模型其中：激励模型浊音：斜三角脉冲清音：高斯白噪声声道模型全极点模型辐射模型 2.3 语音信号产生的声学模型经典的语音信号产生的线性模型提出已经有接近40年的时间虽然不能很完美的体现真实的语音产生机理，但却是语音处理工程应用上最常用的、最成功的模型现有的大多数语音处理技术，如语音编码、语音合成、语音识别等仍然要用到这个经典的线性模型虽然近年来有不少学者提出了更精细的非线性模型，但是由于模型的复杂度，仍然只停留在实验研究阶段。实际上，正常语音的激励模型通常是这二者的混合体 * * 语音的发音器官语音的发音器官语音信号产生的声学原理与声学模型激励源---滤波器---辐射模型激励源三种不同的激励方式：声带的周期振动 Normal high falsetto fry diphthong breathy Modal harsh