語音信号处理.pptVIP

下载本文档

36
0
约3.11万字
约 181页
2017-04-09 发布于上海
举报
版权申诉

語音信号处理.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

語音信号处理

语音信号处理院定选修课学时：32 学分： 2 信号信息处理的重要研究方向语音信号处理 QQ群：郎文辉电话：3419617 第一章绪论研究对象语音：语言的声学表现。由人的发音器官发出的、具有一定语法和意义的声音。重要性：最重要、最有效、最常用、最方便的信息交换手段。“四会” 语音信号处理：用数字信号处理技术对语音信号进行处理。新兴、综合性、交叉学科；涉及到语言学、声学、认知学、心理学。信号与信息处理的重要组成部分热门学科，存在大量机遇研究内容包括：语音编码－压缩语音合成－计算机讲话读文章语音识别－口授打字机等，翻译关键词识别语音增强说话人识别－“声纹”身份识别。教学内容与目标：课程内容：基本概念的建立；各种理论和算法介绍。教学目标：对语音信号处理有基本了解，为以后的研究工作做储备。发展概况： 39年的声码器用于通讯 40年代后期的语谱仪 60年代的数字模型：《语音产生的声学理论》 70年代的LPC 80年代的VQ以及HMM 90年代的神经元等新技术第二章??语音信号处理的基础知识 2.1 概述本章讨论内容 1、语音产生模型线性模型 2、语音学基本内容信息交流“发音－传递－感知”三个阶段发音语音学－确定发音机理较成熟声学语音学－信号分析理论解释语音现象听觉语音学－认识感知的过程 2.2 语音产生的过程语音是具有一定意义的声音 20-20KHz。经分析：欲表达－选择词、语句－控制肌肉运动－振动空气形成语音波声带是位于喉咙中间的两条白色韧带等效为激励源＋声道＋喇叭口声带开启和闭合使气流形成一系列脉冲。每开启和闭合一次的时间即振动周期称为音调周期或基音周期，其倒数称为基音频率，也简称为基频70-350Hz 声道是由咽、口腔和鼻腔组成，它是一根从声门延伸至口唇的非均匀截面的声管等效为激励源＋声道＋喇叭口激励源：声带声带振动频率－基频(基音频率) 清音－声带不振动浊音－声带振动声道：可变谐振腔不同形状、不同音共振(谐振)频率 c为声速，L为声道长度，n为谐振频率的序号分析认为，声道的谐振频率(设截面均匀)：共振峰 Fn的局部最大值，称为共振峰。与声道对应，反映语音的频率特性，是语音的主要特征之一。不同人不同，同一人发不同音时也不同。第一共振峰F1 第二共振峰F2 第三共振峰F3 一般地：语音识别，取前3个共振峰，而对语音合成，需取5个频率范围(Hz) 成年男子成年女子带宽 F1 200～800 250～1000 40～70 F2 600～2800 700～3300 50～90 F3 1300～3400 1500～4000 60～180 2.3 语音信号的特性 2.3.1 语言和语音的基本特性语言，特殊的声音，按一定规则排列声音的物理属性音质：基本特征音调：频率音强：量、响度、幅度音长：声音的长短语音特有的属性音节：语音流的最小单位音素：语音的最小单位，音素构成音节感情：重音语调声调等 2.3.2 语音的时间波形和频谱特性看一段实际语音放大结论1：时间的连续函数、频率幅度随时间变化是随机的元音其中一段再放大结论2：短时间内近似认为不变结论3：元音是准周期函数(基频) 基音周期清音结论4：清音为随机起伏 2.3.3 语音信号的统计特性平稳随机过程：随机信号的统计特性与开始进行统计分析的时刻无关。各态遍历的随机过程：如果所有样本在固定时刻的统计特征和单一样本在全时间上的统计特征一致。语音信号可以看作是一个遍历性随机过程的样本函数。对语音信号进行周期性取样得到的取样序列可以看成是离散时间过程的取样序列。语音信号的统计特性：用振幅概率密度函数和一些平均量（主要是均值和自相关函数）来描述。概率密度的估算：根据长时间范围内一段语音信号的大量取样数据的绝对值计算其直方图。修正伽玛密度（实线）、拉普拉所密度（虚线）相向斯密度（点线）以及天气预报语音的长期幅度分布（不规则的虚线） 2.4 语音信号产生的数字模型理想模型标准准确但不可能，必近似、简化简单最好用成熟的理论线性模型线性系统语音信号脉冲序列脉冲序列－激励源，线性系统－声道＋喇叭口激励源－周期序列(浊音)/随机序列(清音) 线性系统－短时内不变一个实用模型 P16 图2－12 激励模型声道模型辐射模型小结语音的时间波形连续、随