数字语音处理章.pptVIP

下载本文档

2
0
约1.15万字
约 77页
2025-08-17 发布于广东
举报
版权申诉

数字语音处理章.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2.4.语音信号产生的数字模型(a)级联型：第62页，共77页，星期日，2025年，2月5日2.4.语音信号产生的数字模型(b)并联型适用于鼻音、复合元音及大部分辅音，发这些音时发音腔体具有反谐振特性，必须在模型中加入零点以减弱谐振强度，故要考虑用零、极点模型：通常PR，假设分子与分母无公因子且分母无重根，则此式可分解为以下部分分式之和的形式：这就是并联型共振峰模型，每一个二阶因式对应一个共振峰。每个二阶谐振器的幅度可单独控制。第63页，共77页，星期日，2025年，2月5日2.4.语音信号产生的数字模型(b)并联型第64页，共77页，星期日，2025年，2月5日2.4.语音信号产生的数字模型前面两种共振峰模型各自都只能适用于部分语音，级联或并联的级数取决于声道的长度，一般成人取3到5级。级联型结构较为简单，并联型各谐振器幅度可独立控制,综合考虑两者的优缺点可将两种共振峰模型有机地结合起来就得到一种较为完备的共振峰模型。(c)混合型我们可以根据发音的需要自动切换串联或并联通路，此外并联部分还有一条直通路径，其幅度控制因子为AB，这是专为一些频谱特性较为平坦的音素如[f]、[p]、[b]而考虑的，以增强反谐振特性。第65页，共77页，星期日，2025年，2月5日2.4.语音信号产生的数字模型(c)混合型幅度控制因子AB专为一些频谱特性比较平坦的音素，如[f],[p],[b]所考虑的。第66页，共77页，星期日，2025年，2月5日2.4.语音信号产生的数字模型(3)辐射模型在发音腔道内形成的气流经由嘴唇端辐射出来，到达听者耳朵的这段过程，声音信号会衰减，而且有高通滤波的特性，我们常用一个一阶的数字高通滤波器拟这个现象，这个滤波器又叫做辐射模型(radiationmodel)，其数学式如下完整的数字模型的系统函数：第67页，共77页，星期日，2025年，2月5日2.4.语音信号产生的数字模型总结：1.此模型并非最完备的模型，因为它对一些音是不适用的如浊音中的摩擦音，这种音要有发浊音和清音的两种激励，而不是简单的叠加关系，对这些音我们可用更精确的模型来模拟。2.语音产生的数字模型中增益控制（对Av或AN）代表了输出语音的音响强度；时变线性系统主要用来模拟声道的特性；3.数字语音处理中两个基本问题，即语音分析和语音合成，都是基于这个模型来实现的；4.此数字模型的特点：系统参数固定不变—短时分析；全极点性质—零点可由多个极点逼近；激励源和声道互相独立—适用于大多数数字语音处理。返回第68页，共77页，星期日，2025年，2月5日2.5.人类的听觉功能用语言作沟通，就是说话的人能让对方听懂他在说些什么，双方用说与听来达成信息交换与感情交流。而语言的学习过程，更是不断地听，然后学习会说，所以语言与听觉有密切的关联性。本节将说明人类听觉器官的构造，以及如何听声音。并且对于人耳在听觉上的一个重要特性，听觉掩蔽效应做了简要叙述，这是语音处理中常常会用到的听觉特性。第69页，共77页，星期日，2025年，2月5日2.5.人类的听觉功能图5-1听觉器官简图第70页，共77页，星期日，2025年，2月5日2.5.人类的听觉功能图5-2听觉过程第71页，共77页，星期日，2025年，2月5日2.5.人类的听觉功能外耳从耳翼(pinnas)到鼓膜(eardrum)这一段叫做外耳。耳翼的功能在帮助判断声音的来源方向，它对于听者前方来的声音比较敏感。耳翼到鼓膜之间的通道叫做耳道（meatus)，这是一个长约2.7公分直径约0.7公分的通道。对于声波的传播而言，这条通道等于是一个四分之一波长的共振腔，它的第一个共振频率大约是3kHz，这个共振作用将3～5kHz的声波放大15dB左右，因此使得我们的听觉对于3～5kHz的频率范围比较敏感。第72页，共77页，星期日，2025年，2月5日2.语音产生过程语音的两个重要声学特性：共振峰(Fn,n=1,2,...)：声道是一个谐振腔，它放大声音气流的某些频率分量而衰减其他频率分量，被放大的频率我们称之为共振峰或共振峰频率。声道具有的一组共振峰，声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道某一瞬间的形状和尺寸，因而不同的语音对应于一组不同的共振峰参数。实际应用中，头三个共振峰最重要。第30页，共77页，星期日，2025年，2月5日2.语音产生过程理想状态下共振峰的计算：假设声道截面是均匀的（此时可把声道看作一个粗细均匀的圆筒），从喉到唇