- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 数字模型
两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象称为掩蔽效应。 在掩蔽情况下,被隐蔽音的听阈会提高,即加大被掩蔽音的强度才能听到。 2.4.4 掩蔽效应 利用人耳的听觉掩蔽,在进行语音压缩时,让量化噪音的频谱跟随语言信号频谱包络变化,则共振峰的频率成分就会掩蔽掉量化噪声。这个技术称为噪声整形或听觉加权处理。 掩蔽效应的作用 2.5 语音信号模型 语音信号的数字模型: 利用数字技术模拟语音信号的产生或是利用数字信号处理技术来实现发音器官的模拟。 在一些合理的假设下,在较短的时间间隔内 (10-30ms),语音信号被看成是线性时不变系统 (声道)在随机噪声或准周期脉冲激励下的输出。 uG(n) Av 冲激序列 发生器 声门脉冲 模型G(z) 随机噪声 发生器 基音周期T0 Au 清/浊音开关 浊音激励 清音激励 2.5.1 激励模型 1、 浊音激励 发浊音时,由于声门不断开启和关闭,产生间歇的脉冲。经仪器测试它类似于斜三角形的脉冲。 单个斜三角波的频谱表现出一个低通滤波器G(ejω)的特性。可以把它表示成z变换的全极点形式: X(n)每两个相邻非零值之间还有若干零值。 * 第2章 语音信号的数字模型 2.1 概述 1 2.2 语音的发音机理 2.3 语音的听觉机理 3 2.4 语音的感知 4 2.5 语音信号模型 5 2.6 语音信号数字模型 6 2 2.1 概述 本章重点介绍语音信号产生的数字模型,对语音信号的特性和听觉特性做一般介绍。 2.2 语音的发音机理 1.组成 ⑴ 肺和气管组成声源; ⑵ 喉和声带称为声门; ⑶ 由咽腔、口腔、鼻腔组成声道; 2.2.1 人的发音器官 2. 功能 肺:产生压缩气体,通过气管传送到声音生 成系统。 喉:控制声带运动的复杂系统。主要包括: 环状软骨、甲状软骨、杓状软骨、声带。 (a)闭合状态 (b)张开状态 图 2.2 喉的生理结构 声门:声带之间的间隙称为声门。 主要功能:产生激励。 声道:指声门至嘴唇的所有发音器官。 包括:咽喉、口腔和鼻腔。 主要功能:传输调制声波。 声道的形状变化由舌、软腭、唇、牙决定。 口腔包括:上下唇、上下齿、上下齿龈、上下腭、 舌和小舌等部分。 上腭又分为:硬腭和软腭两部分; 舌又分为:舌尖、舌面和舌根三部分。 鼻腔在口腔上面,靠软腭和小舌将其与口腔隔开。 当小舌下垂时,鼻腔和口腔便耦合起来,当小 舌上抬时,口腔与鼻腔是不相通的。口腔和鼻腔都 是发音时的共鸣器。 图2.3 声道纵剖面图 图 2.4 发音器官机理模型 空气由肺部排入喉部,经过声带进入声道,最 后由嘴辐射出声波,这就形成了语音。 声门子系统 声道系统 辐射系统 2.2.2 语音生成 语音生成动作可分为两种功能: (1)激励 (2)调制 2.2.2 语音生成-浊音 空气流经过声带时,如果声带是崩紧的,则声带将产生张 弛振动,即声带将周期性地启开和闭合。 声带启开时,空气流从声门喷射出来,形成一个脉冲,声 带闭合时相应于脉冲序列的间隙期。 这种情况下在声门处产生出一个准周期脉冲状的空气流。 该空气流经过声道后最终从嘴唇辐射出声波,这便是浊音语 音。 这个准周期脉冲的周期即为基音周期。 基音周期:声带每开启和闭合一次的时间。其倒 数称为基音频率。 基音频率是由声带张开闭合的周期所决定的: 男性的基音频率一般为50~250Hz; 女性基音频率为100~500Hz。 2.2.2 语音生成-清音 空气流经过声带时,如果声带是完全舒展开来的,则肺部发出的空气流将不受影响地通过声门。空气流通过声门后,会遇到两种不同情况。 一种情况是,如果声道的某个部位发生收缩形成了一个狭窄的通道,当空气流到达此处时被迫以高速冲过收缩区,并在附近产生出空气湍流,这种湍流空气通过声道后便形成所谓摩擦音或清音。 2.2.2 语音生成-爆破音 另一种情况是,如果声道的某个部位完全闭合在一起,当空气流到达时便在此处建立起空气压力,闭合点突然开启便会让气压快速释放,经过声道后便形成所谓爆破音。 共振峰频率或共振峰
文档评论(0)