第二章语音信号的基础知识课件.pptVIP

下载本文档

5
0
约2.33千字
约 56页
2016-07-19 发布于河南
举报
版权申诉

第二章语音信号的基础知识课件.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

苗立刚 ligangmiao@; 语音(Speech)=声音(Acoustic)+语言(Language) 语音是由一连串的音素组成语言的声音。;对语音的研究包括两个方面; 语音学和语音信号处理联系更加紧密。如：运用现代信号处理技术建立发音的数学模型，确定发音方法；用声学和非平稳信号分析理论来解释各种语音现象；语音信息的存储形式等。; 语音信号的产生语音信号的感知（了解）语音信号的线性产生模型语音信号的非线性产生模型（了解）; 人类的说话过程分五个阶段;语音的发音器官;肺和气管;甲状软骨; 当说话时，声带在软骨的作用下相互靠近但不完全闭合，声门变成一条窄缝。当气流通过气管经过咽喉时，收紧的声带由于气流的冲击而产生振动，不断地张开和闭合，使声门向上送出一连串喷流。; F0 =1/Tp，基音频率，由声带的质量来决定。 F0的大小决定了声音的高低，称为音高。男性的F0大致分布在：60-200Hz 女性和儿童的F0大致分布在：200-450Hz;声道;鼻端;一种声道形状对应一套共振峰不同人的声道大小不同，共振峰不同同一人，发不同音，共振峰也不同声道的作用相当于一个滤波器，它放大（或增强）某些频率而衰减其他频率分量;;等效为激励源＋声道＋喇叭口; 发音的分类;一语音信号的产生; 语音是发声器官发出的一种声波，具有一定的音色、音调和音强和音长。 ●音色: 又称为音质，是一种声音区别于另一种声音的基本特性。与声带的振动频率、发音器官的送气方式和声道的形状、尺寸密切相关。 ●音调：声音的高低，取决于声波的频率。 ●音强：声音的强弱，它由声波的振动幅度所决定 ●音长：声音的长短，取决于发音持续时间的长短，; 语音信号的时域和频域表示;一语音信号的产生;一语音信号的产生; 语音信号的语谱图;load mtlb specgram(mtlb,512,Fs,kaiser(500,5),475) title(Spectrogram);load specgram.mat wavplay(a,Fs) specgram(a,512,Fs,kaiser(500,5),475); 汉语中语音的分类;; 在汉语中，由音素构成声母和韵母。; 韵母：在音节中占主要部分，音节中除了头上的声母以外的部分，由单、双元音、元音带上辅音等几种不同的形式组成。所有元音都是浊音。 a、o、e、i、u、ü、ê 单韵母（元音） ai、ei、ao、ou、ia、ie、iao、iou、ua、uo、uai、uei 、üe 复韵母 an、en、ang、eng、ong、ian、in、iang、ing、iong、uan、uen、uang、ueng、 üan、ün 鼻韵母; 韵母是由单、双元音、元音带上辅音等几种不同的形式组成。不同的元音有不同的基音频率和共振峰模式，它们是区别不同韵母的重要参数。;注意区别下述不同的概念; 声母、韵母和声调是汉语语音的三要素。汉语语音的1个不同于其他语言的是它具有声调（音调）。声调是1个音节在念法上的高低升降的变化，汉语中有4个声调，即阴平（－）、阳平（ ′）、上声（ ? ）、和去声（‵）。; 声调的变化就是浊音基音周期的变化，为了将调值描写地具体一些，一般采用“五度标记法”，用一条竖线表示声音的高低，从下而上用1、2、3、4、5依次表示低、半低、中、半高、高。; 单独发声的一个音节或是语音流中的任何一个音节都可能由7部分组成。;二语音信号的感知（自学）;三语音信号的线性产生模型;; 激励模型; 发浊音时，声激励是一个准周期的单位脉冲串，Av为增益参数；为了使浊音的激励信号逼近声门振动气流的实际波形，需将冲激序列通过一个声门脉冲模型滤波器（实际上是一个斜三角波形）G(z)。最后形成一个以基音周期为周期的斜三角型脉冲波。;单位脉冲串;2）清音激励; 将声激励分为两种情况，与实际不完全相符。例如爆破音是气流在声门完全闭合处的下方建立起压力，然后除去这种障碍，使压力迅速释放，产生一种瞬时的激励。在上面的声学模型中未考虑。应将两种激励按一定比例进行叠加，更符合实际情况。;声道模型(共振峰模型);三语音信号的线性产生模型;2）共振峰模型; 传输函数是一个全极点的IIR滤波器，这些极点确定了声管的共振峰。若N取偶数，V(z)一般有N/2对共轭极点，rkexp(±j2?FkT)，k=1～N/2。各个wk值分别与语音的共振峰相互对应。 N的取值一般为8～12。;;（3

您可能关注的文档

文档评论（0）

lifang365 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第二章语音信号的基础知识课件.pptVIP