【2017年整理】语音信号处理复习纲要.docVIP

下载本文档

1
0
约 16页
2017-09-10 发布于浙江
举报
版权申诉

【2017年整理】语音信号处理复习纲要.doc

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

【2017年整理】语音信号处理复习纲要

Ch1 绪论 §1.1 语音信号处理概述一、语音、语音信号处理的名词解释 1、语音：是语言的声学表现，是声音和意义的结合体，是相互传递信息的重要手段，是人类最重要、最有效、最常用和最方便的交换信息的形式。 2、语音信号处理：是研究用数字信号处理技术对语音信号进行处理的一门学科，它是一门新兴的学科，同时又是综合性的多学科领域和涉及很广的交叉学科。二、语音学的名词解释（集中备课）语音学：是研究言语过程的一门科学，它包括三个研究内容：发音器官在发音过程中的运动和语音的音位特性；语音的物理特性；以及听觉和语言感知。 §1.2 语音信号处理的发展概况 1、语音编码：语音编码技术是伴随着语音信号的数字化而产生的，目前主要应用在数字语音通信领域。 2、语音合成：语音合成的目的是使计算机能像人一样说话。 3、语音识别：语音识别是使计算机判断出所说的话得内容。 Ch2 基础知识 §2.2 语音产生的过程一、语音、清音、浊音 1、语音：声音是一种波，能被人耳听到，振动频率在20Hz-20kHz之间。语音是声音的一种，它是由人的发音器官发出的、具有一定语法和意义的声音。语音的振动频率最高可达15kHz左右。 2、浊音、清音：语音由声带振动或不经声带振动来产生，其中由声带振动产生的音统称为浊音，而不由声带振动产生的音统称为清音。浊音中包括所有的元音和一些辅音，清音包括另一部分辅音。二、语音的产生过程：空气从肺部排出形成气流。空气通过声带时，如果声带是紧绷的，则声带将产生张弛振动，即声带周期性地开启和闭合。声带开启时，空气流从声门喷射出来，形成一个脉冲；声带闭合时相应于脉冲序列的间歇期。三、基音周期、基音频率基音周期：声带开启和闭合一次的时间即振动周期称为音调周期或基音周期。基音频率：基音周期的倒数称为基音频率，简称为基频。四、浊音、清音、爆破音的激励源对于浊音、清音和爆破音来说，激励源是不同的，浊音语音是位于声门处的准周期脉冲序列，清音的激励源是位于声道的某个收缩区的空气湍流，而爆破音的激励源是位于声道某个闭合点处建立起来的气压及其突然释放。五、共振峰的概念（参见大纲） 1、共振峰名词解释：声道是一个分布参数系统，它是一个谐振腔，有许多谐振频率，称为共振峰，它是声道的重要声学特征。 2、共振峰的公式：Fn=(2n-1)c/4L（会运用公式进行计算，填空、选择） 3、谐振点间的间隔不同，但平均仍然大约为每1KHz有一个谐振点。 4、声道的共振峰特性决定所发声音的频谱特性（音色）。 5、头三个共振峰最重要。 §2.3 语音信号的特性一、语音的物理属性（集中备课）语音的物理性质包括音质、音调、音强、音长等特性。语音是人的发音器官发出的一种声波，具有声音的物理属性。音质是一种声音区别于其他声音的基本特征；音调指声音的高低，取决于声波的频率：频率高则音调高，频率低则音调低；响度是指声音的强弱，又称音量，它是由声波震动幅度决定的；声音的长短也称音长，它取决于发音持续时间的长短。二、音素、音节、单词、句子的基本概念以及它们之间的关系（集中备课）（1）音素是语音的最小、最基本的组成单位，音素都有其独立的各不相同的发音方法和发音部位，它是使听者能区别一个单词和另一个单词的声音的基础。（2）音节是最小的语言片段，一个音节由一个或几个音素组成。（3）单词是由音节结合而成的更大单位，是有意义的语言的最小单位。（4）句子是单词的进一步组合。三、汉语的特点是：音素少、音节少。汉语中的音节即字音由声母、韵母和声调按一定方式构成，即声、韵、调三个因素构成。四、语音频谱特性其中虚线称为谱包络，其形状是由H(f)和G(f)的包络乘积得到的。五、清音和浊音的频谱特性清音和浊音的波形有很大的不同。清音的波形类似于白噪声，具有很弱的振幅；元音（浊音）具有明显的准周期性，并具有较强的振幅。它们的周期对应的频率就是基音频率。如果考察其中一个周期，还可以大致看出其频谱特性。 §2.4 语音信号产生的数学模型一、语音信号的数字模型（集中备课） 1、语音信号数字模型的概念：语音信号被看成是线性时不变系统（声道）在随机噪声或准调周期脉冲序列激励下的输出。 2、语音信号的产生模型P16（重点注意）二、发不同性质的音时，激励的情况是不同的，大致分为两类：（1）发浊音时，此时气流在通过绷紧的声带时，冲激声带产生振动，使声门处形成准周期性的脉冲串。声带绷紧的程度不同时，振动频率也不同，这个频率就是音调频率，其倒数为音调周期。不同人的音调周期是不同的，男子大，女子小，老人大，小孩低。（2）发清音时，此时声带松弛而不振动，气流通过声门直接进入声道。三、语音信号数字模型的组成等（集中备课） 1、语音信号数字模型由激励模型、声道模型和辐射模型组