语音信息处理.pptVIP

下载本文档

0
0
约4.71千字
约 46页
2025-08-30 发布于广东
举报
版权申诉

语音信息处理.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

国外发展历史?20世纪60年代末70年代初Baum等人首次系统地阐述了马尔可夫模型（HMM，HiddenMarkovModel），并把它引入语音识别。目前，HMM模型是语音识别的最好算法，它也广泛应用于经济学上的预测问题。?与此同时，语音识别的线性预测参数LPC首次被提出来，采用线性预测进行研究的实践开始。以后的低速率语音编码技术，很大程度上都是依靠线性预测进行来实现的。?第29页，共46页，星期日，2025年，2月5日国外发展历史同时，动态时间弯曲DTW技术出现，有效的解决了语音识别过程中，不等音长的匹配问题。此时的许多系统，都是建立在LPC参数和DTW匹配技术基础上的孤立词识别系统。美国国防部高级计划研究局（ARPAR）的语音识别和理解研究计划，产生了HAPPY，HEARSAY-II和DRAGON等典型的语音识别理解系统，提出了具有深远意义的知识源黑板模型，扩充转移网络（ATN）算法等。第30页，共46页，星期日，2025年，2月5日国外发展历史?20世纪80年代贝尔实验室Rabiner等人对HMM模型进行了深入浅出的介绍，从此以后HMM模型在语音识别领域里确立了不可替代的地位，成为目前世界各国从事语音处理的最有效的方法。矢量量化法VQ也在此时开始应用到语音识别中。1987年，IBM公司采用VQ/HMM方案实现了一个具有2000个孤立字的特定人语音识别模型系统Tangora-2000。1988年CMU同样采用VQ/HMM实现了一个具有977个词，并且能构成4200个句子的非特定人连续语音识别系统SPHINX。第31页，共46页，星期日，2025年，2月5日国外发展历史20世界90年代，语音识别开始从实验室走向市场。CMU、BBN、IBM和ATT都推出自己的语音识别产品。Microsoft、Apple、Toshiba、Philips和Intel不甘落后，也开始致力于语音识别系统开发。语音识别朝着大词汇量、非特定人、自然连续语音方向发展。目前，MicrosoftOfficeXP以上版本已经集成了语音识别功能，可以采用语音输入法输入汉字。

第32页，共46页，星期日，2025年，2月5日国外主要的研究单位：美国的CMU（卡内基梅隆大学）、MIT（麻省理工学院）、IBM、美国电报电话公司ATT英国的Cambridge（剑桥大学）第33页，共46页，星期日，2025年，2月5日第1页，共46页，星期日，2025年，2月5日第一讲绪论1.语音信号处理的概念2.语音信号处理的学科基础3.语音信号处理的分支和应用4.语音信号处理的发展历史5.本课程的内容和特点6.参考书目7.学习要求第2页，共46页，星期日，2025年，2月5日1.语音信号处理的概念语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。第3页，共46页，星期日，2025年，2月5日2.语音信号处理的学科基础语音识别声学信息论语音、语言学信号处理人工智能模式识别数理统计听写机查询系统电话拨号残疾人用品消费电子……实际应用学科基础语音识别的应用背景和学科基础第4页，共46页，星期日，2025年，2月5日3.语音信号处理的分支和应用语音识别语音合成语音编码说话人识别第5页，共46页，星期日，2025年，2月5日3.1语音识别(1)语音识别研究的目的就是研究出一种具有听觉功能的机器，能直接接受人口呼的命令，理解人的意图，并做出相应的反应。第6页，共46页，星期日，2025年，2月5日语音识别的应用语音识别技术在信息处理领域的首要的巨大应用将在于提供了一种全新的人机交互形式。苹果的Siri。Siri恶搞，国人Siri，Siri惊魂，Siri日式英语。语音输入法。第7页，共46页，星期日，2025年，2月5日语音识别的分类针对说话人：特定说话人语音识别和非特定说话人语音识别针对词汇量：小词汇量、中词汇量和大词汇量的识别针对说话方式：孤立词识别和连续语音识别针对识别环境：实验室环境语音识别、电话语音识别和广播语音识别第8页，共46页，星期日，2025年，2月5日语音信号和自然语言的多变性和复杂性(1)连续语音词与词之间没有明显的停顿，词与词之间的分割比较困难；(2)每一个基本的声学识别基元（如音素）受前后音素发音方式的影响（协同发音）使特征变得不稳定(3)不同人、不同心理和生理以及在不同的说话环境下说同一词时，声学信号特征会发生变化；(4)一个词的读音不仅包含