- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章-语音信号的声学基础.ppt
第二章 语音的声学基础与产生模型 2.1 语音信号的产生 肺(lung)与气管(trachea) ------声音产生的能量来源 声带(vocal cords),又称为喉(larynx) ------控制气流从气管到口腔的流动,周期性的振动(浊音)或不振动(清音) 声道(vocal tract):包括咽(pharynx)、口腔(oral cavity)、鼻腔(nasal cavity) ------ 包括舌头、牙齿、软腭、唇等主要发音器官(articulator);其形状和位置决定了所发的声音;作用类似于声学管道(滤波器);长度约17cm(成年男子) 激励源(Excitation source) 肺部产生气流 气流通过气管 气流受声带的开、关周期振动控制其通过方式 声道滤波器(Vocal tract filter) 通过发音器官的不同位置与形状对通过声道的气流进行调制 某些频率成分的能量被放大,另一些频率成分的能量则被减小 辐射(Radiation) 经过调制的声音经嘴唇或鼻孔辐射 声带周期振动 产生周期脉冲激励信号 发出浊音:类似音乐声,有基频,如汉语的元音 声带不振动,放松状态 摩擦形成湍流(turbulence) 发出摩擦音:类似噪声,如汉语的辅音/c/,/s/,/h/等 声带放松,舌头和嘴唇先紧闭再突然放开 产生短脉冲 发出爆破音,如汉语的/b/,/p/,/t/等 声道通常被认为是一个截面积随时间和位置而改变的管道。 起到类似滤波器的功能,对激励源信号进行滤波 多个共振峰(formant):对某一频率的信号产生共鸣(resonance), 对应频谱的波峰 基频描述激励源的振动频率; 共振峰刻画声道的调制(滤波)。 鼻腔耦合产生鼻音 能量集中在低频部分 和口腔产生的共鸣反应(共振)相反,出现反共鸣(anti-resonance),对应频谱的波谷 嘴唇辐射 通过改变管道的边界条件(开口或闭口)改变气流的传递方式 调音方式(manner of articulation) 控制气流的流动方式 区分清音和浊音 决定不同类型的语音的产生:元音、半元音、鼻音、卷舌音、爆破音、摩擦音、塞擦音等等 调音位置(place of articulation) 主要是通过发音器官位置的改变来控制调音位置 例如元音的进一步细分主要是靠舌位的改变来实现 对给定的语音信号画对应的语谱图是语音分析的经典方法。虽然目前在语音工程应用上已经很少使用语谱图,但它却是初学者认识语音的最好的工具与分析方法。 语谱图通常会分为宽带语谱图和窄带语谱图,从二者可以得到关于语音信号的不同的特征。 我们会在第三章介绍语音信号的特征分析时再详细介绍语谱图的产生方法 2.2 语音信号的感知 语音信号的感知:听觉系统 听觉神经 大脑 人耳的构造与功能: 外耳:声音的收集、定位、放大 定位:双耳结构可以实现水平方向的定位;耳翼的不规则结构则可以实现垂直方向的定位 放大:外耳道可以看作是一个均匀管道(长25mm),其共振峰频率约为3400Hz。外耳可以实现声音放大约20dB 中耳:声音的传导、放大、保护内耳 中耳可以放大声音约30dB 内耳:包含半规管、前庭窗以及耳蜗,其中耳蜗跟听觉密切相关 耳蜗根据接收到的声音来相应地刺激听神经,实现机械振动到神经信号的转换 耳蜗根据频率选择特性向听神经传递信号 耳蜗是听觉系统中最脆弱、最重要的部分。 通常,人的左、右耳对声音的感知是不太一样的,这种差异性因人而异 人耳的听觉过程示意图 /webcontent/animations/content/soundtransduction.html 人听觉特性: 2.3 语音信号产生的声学模型 其中: 激励模型 浊音:斜三角脉冲 清音:高斯白噪声 声道模型 全极点模型 辐射模型 2.3 语音信号产生的声学模型 经典的语音信号产生的线性模型提出已经有接近40年的时间 虽然不能很完美的体现真实的语音产生机理,但却是语音处理工程应用上最常用的、最成功的模型 现有的大多数语音处理技术,如语音编码、语音合成、语音识别等仍然要用到这个经典的线性模型 虽然近年来有不少学者提出了更精细的非线性模型,但是由于模型的复杂度,仍然只停留在实验研究阶段。 实际上,正常语音的激励模型 通常是这二者的混合体 * * 语音的发音器官 语音的发音器官 语音信号产生的声学原理与声学模型 激励源---滤波器---辐射 模型 激励源三种不同的激励方式: 声带的周期振动 Normal high falsetto fry diphthong breathy Modal harsh
您可能关注的文档
最近下载
- 血清酶变化的生理病理机制.ppt VIP
- 2025年秋季新教材部编版小学道德与法治三年级上册全册道法核心素养教案(教学设计)含教学反思.docx VIP
- 《智能机械与机器人》课件——3室内喷涂机器人施工工艺.pptx VIP
- 公司出门条模板.doc VIP
- 最新五年级(上册)《生活生命与安全》(全册)教案.docx
- 科学开学第一课.ppt VIP
- 《智能机械与机器人》课件——地面抹平机器人.pptx VIP
- (统编版2025新教材)道德与法治三年级上册开学第一课.pptx
- 1.2《我们都是社会的一员》【课件】2025-2026学年度统编版道德与法治八年级上册.pptx VIP
- 《智能机械与机器人》课件——地面整平机器人.pptx VIP
文档评论(0)