《数字语音处理》PPT课件.pptVIP

下载本文档

58
0
约9.09千字
约 75页
2018-06-06 发布于上海
举报
版权申诉

《数字语音处理》PPT课件.ppt

1、本文档共75页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《数字语音处理》PPT课件

数字语音处理李香春《数字语音处理》教学大纲课程名称：数字语音处理课程英文名称：DIGITAL SPEECH PROCESSING 总学时：32 讲课学时：32 学分：2 开课单位：信息学部通信工程系授课对象：电子信息工程专业及通信工程专业先修课程：信号与系统数字信号处理基础《数字语音处理》教学大纲教材：《数字语音处理》，姚天任编，华中科技大学出版社，1992 教学参考书：《语音信号数字处理》，杨行峻、迟惠生编，电子工业出版社《语音信号处理》，易克初等编，国防工业出版社，2000 教学目的：本课程作为本科生的一门选修课，主要向学生系统地介绍语音信号处理中的基本理论、方法，包括：语音信号的编码压缩技术、语音识别技术、语音合成技术。通过本课程的学习使学生掌握本课程的基本方法，开阔视野，为今后从事相关的研究开发工作奠定基础。学时安排第一章绪论（共1学时）语音信号处理的发展历史，语音信号处理的分类,语音识别技术的分类。第二章语音信号产生的数字模型（共2学时）发音器官的生理、语音信号的产生模型第三章语音波形的数字编码（共4学时）语音编码的基本方法, 子带编码。第四章短时时域处理技术（共4学时）短时能量、短时平均幅度、短时平均过零率、短时自相关函数学时安排第五章短时傅里叶分析（共4学时）第六章语音信号的线性预测（共3学时）线性预测分析基本原理，基于自相关的线性预测分析。第七章语音信号的同态预测和倒谱分析（共4学时）第八章矢量量化（共4学时）矢量量化的基本原理、特征矢量及畸变准则的选择，LBG算法。第九章隐马尔科夫模型（共4学时）第十章数字语音处理的应用（共2学时）考核方式方式1：平时：小测验4次，占总成绩的70%-80% 期末：总结报告，占总成绩的20%-30% 方式2：平时：报告1份，占总成绩的20%-30% 期末：闭卷考试，总成绩的70%-80% 1.绪论语音信号处理的研究内容语音信号处理的发展历史讲授内容语音信号处理的研究内容语音信号的数字表示方法波形表示：参数表示：语音信号处理的方法和技术时域、频域和变换域语音信号处理的应用识别、合成、压缩、增强语音信号的数字表示方法如何选择表示方法？保存消息内容便于传输和贮存便于变换和处理不能严重损害消息内容波形表示法波形表示法波形表示法参数表示法参数表示法：语音信号看成是某个模型在一定激励作用下产生的输出，而激励源和模型的参数便作为语音信号的表示。 W=f(A,B) A激励，B模型参数例：产生“信息学部”的语音信号 W=f（信息学部，140）语音信号处理的方法和技术时域（时变信号，但短时平稳）短时处理技术短时能量短时平均过零率短时自相关频域短时傅里叶分析变换域小波变换语音信号处理的应用语音压缩和编码:语音通信数字化；语音合成：自动报站、自动报时、自动警告、电话自动查询和语音提示等；语音识别:声控应用、自动口语翻译；说话认识别:安全加密、银行信息电话查询服务以及破案和法庭取证；语音增强:通常作为语音处理的前端。语音处理的发展历史（1）语音处理的发展历史（2） 1947年贝尔实验室发明语谱图仪—语音信号研究的开始；语音处理的发展历史（3） 50年代第一台口授打字机和英语单词语音识别器； 60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器； 70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别； 80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机，Dragon Dictate 词汇翻译系统(70000)，汉语听写机。CMU语音组研制成功SPHINX系统（997，95.8%); 国内，清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。讲授内容语音信号产生的数字模型语音信号处理方法语音波形编码方法短时处理方法（时频域）线性预测、倒谱、矢量量化隐含马尔科夫模型（HMM）语音信号处理的应用语音压缩、合成、识别、增强 2.语音信号产生的数字模型人类语音的产生过程复杂信息丰富多样至今尚未找到理想模型来描述语音产生过程 Fant于1960年提出的线性模型是模拟语音主要特征的比较成功的模型之一人类发音的生理过程语音信号的声学特性 2.1人类的语言器官人类的语言器官 2.2语音产生过程（1）浊音产生机理浊音——声带绷紧，气流使声带产生张弛振动，即声带将周期性的启开和闭合。例如： a，o，e。声带开启：气流从声门喷射出来，