第3章 语音信号模型.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声门处激励的数字模型: 语音分成清音和浊音,清音由随机噪声激励产生 浊音由准周期脉冲串激励产生,其周期称为基音周期。 图3.18:浊音情况下,激励信号的产生示意图。 ◆冲激串发生器输出的单位冲激序列(冲激间隔为基音周期)。 ◆线性激励系统函数为G(z),经幅度控制后输出为浊音激励。 ◆G(z) 的反变换 g(n) 可以用Rosenberg函数近似表示: 式中,N1 ——斜三角波上升部分的时间,约占基音周期的50%; N2 ——斜三角波下降部分的时间,约占基音周期的35%。 第2章 数字语音处理基础 3.5 语音信号的数字模型 图3.18 浊音信号激励的产生 基音周期 增益控制Av 冲激串发生器 G(z) ? 斜三角波的占时比例关系与声带开启面积的与时间关系对应。 图3.19:单斜三角波波形及频谱。 ◆是低通滤波器。 ◆其 z 变换的全极点(二极点)模型: 式中,C 是一个常数。 斜三角波串可看成加权单位脉冲 激励单斜三角波模型的结果。 ◆ Av是单位脉冲串的幅度因子; ◆单位脉冲串的z 变换为: 完整的激励模型为: 第2章 数字语音处理基础 3.5 语音信号的数字模型 图3.19 单个斜三角波及其频谱 1.0 0.8 0.6 0.4 0.2 0 5 10 15 20 t/ms g(n) 20 lg G(ejω) 30 20 10 0 ?10 ?20 ?30 1 2 3 f /kHz 清音情况下,发塞音或摩擦音,声道被阻形成湍流。 ◆激励可模拟成随机白噪声, ◆用均值为0、方差为1,时间或/和幅值为白色分布的序列。 图3.20:考虑所有的激励因素,语音产生的数字模型。 ◆特点:二元激励,浊音、清音激励交替进行。 ◆声道可以用多种滤波器来模拟, ◆通常,把辐射和声道等因素全部结合,表示为全极点函数: 第2章 数字语音处理基础 3.5 语音信号的数字模型 图3.20 语音产生的数学模型 基音周期 增益控制Av am, G PL(n) 增益控制AN 冲激串发生器 G(z) 白噪声发生器 V(z) R(z) ? ? 结论: ◆优点:该模型对大多数语音是一个好模型, 能合成出较满意的语音,是分析语音最重要的基础。 ◆缺点:二元激励模型有局限性。 模型建立“短时”平衡为前提,不完全符合实际; 理论上鼻音和擦音需有零点, 浊擦音不是简单的浊音和清音的叠加。 该模型不能给出模拟。 第2章 数字语音处理基础 3.5 语音信号的数字模型 第3章 语音信号的模型 3.6 语音信号的共振峰模型 将声道看成为谐振腔,共振峰是该腔体的谐振频率。 ◆柯蒂氏器官的纤毛细胞按频率感受排列,故共振峰模型有效。 实践证明:◆元音用前 3 个共振峰。 ◆辅音或鼻音,用到 5 个以上的共振峰。 应用物理学,易推导出均匀断面声管的共振峰频率。 例:成人声道约为17.5 cm, 可计算出:f1 = 500 Hz,f2 = 1500 Hz,f3 = 2500 Hz。 发[e]时声道最接近均匀断面,其共振峰最接近上述值。 从语音信号求出共振峰频率、带宽和幅度的方法是重要的。 三种实用的共振峰模型:级联型、并联型、混合型。 第2章 数字语音处理基础 3.6  语音信号的共振峰模型   3.6.1 级联型共振峰模型 级联型共振峰模型认为声道是一组串联的二阶谐振器。 ◆声道有多个谐振频率和反谐振频率,可模拟为零极点模型。 ◆一般元音,使用全极点模型,其传输函数如下:

文档评论(0)

0520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档