人工智能导论课件第11章第6-7节.pptx

下载文档

0
0
约6.28千字
约 33页
2025-04-03 发布于浙江
举报
版权申诉
保障服务

人工智能导论课件第11章第6-7节.pptx

1、本文档共33页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

1语音处理的发展2语音理解3语音识别第6节

11.6语音处理语音处理（speechsignalprocessing）是研究语音发声过程、语音信号的统计特性、语音的自动识别、机器合成以及语音感知等各种处理技术的总称。由于现代的进音处理技术都以数字计算为基础，并借助微处理器、信号处理器或通用计算机加以实现，因此也称数字语音信号处理。语音信号处理是一门多学科的综合技术。它以生理、心理、语言以及声学等基本实验为基础，以信息论、控制论、系统论的理论作指导，通过应用信号处理、统计分析、模式识别等现代技术手段，发展成为新的学科。

11.6.1语音处理的发展语音信号处理的研究起源于对发音器官的模拟。1939年美国H．杜德莱展示了一个简单的发音过程模拟系统，以后发展为声道的数字模型。利用该模型可以对语音信号进行各种频谱及参数的分析，进行通信编码或数据压缩的研究，同时也可根据分析获得的频谱特征或参数变化规律，合成语音信号，实现机器的语音合成。利用语音分析技术，还可以实现对语音的自动识别，发音人的自动辨识，如果与人工智能技术结合，还可以实现各种语句的自动识别以至语言的自动理解，从而实现人机语音交互应答系统，真正赋予计算机以听觉的功能。

11.6.1语音处理的发展语言信息主要包含在语音信号的参数之中，因此准确而迅速地提取语言信号的参数是进行语音信号处理的关键。常用的语音信号参数有：共振峰幅度、频率与带宽、音调和噪音、噪音的判别等。后来又提出了线性预测系数、声道反射系数和倒谱参数等参数。这些参数仅仅反映了发音过程中的一些平均特性，而实际语言的发音变化相当迅速，需要用非平稳随机过程来描述，因此，20世纪80年代之后，研究语音信号非平稳参数分析方法迅速发展，人们提出了一整套快速的算法，还有利用优化规律实现以合成信号统计分析参数的新算法，取得了很好的效果。

11.6.1语音处理的发展当语音处理向实用化发展时，人们发现许多算法的抗环境干扰能力较差。因此，在噪声环境下保持语音信号处理能力成为了一个重要课题。这促进了语音增强的研究。一些具有抗干扰性的算法相继出现。当前，语音信号处理日益同智能计算技术和智能机器人的研究紧密结合，成为智能信息技术中的一个重要分支。

11.6.1语音处理的发展语音信号处理在通信、国防等部门中有着广阔的应用领域。为了改善通信中语言信号的质量而研究的各种频响修正和补偿技术，为了提髙效率而研究的数据编码压缩技术，以及为了改善通信条件而研究的噪声抵消及干扰抑制技术，都与语音处理密切相关。在金融部门应用语音处理，开始利用说话人识别和语音识别实现根据用户语音自动存款、取款的

业务。在仪器仪表和控制自动化生产中，

利用语音合成读出测量数据和故障警告。

随着语音处理技术的发展，可以预期它将

在更多部门得到应用。

11.6.2语音理解人们通常更方便说话而不是打字，因此语音识别软件非常受欢迎。口述命令比用鼠标或触摸板点击按钮更快。要在Windows中打开如“记事本”这样的程序，需要单击开始、程序、附件，最后点击记事本，最轻松也需要点击四到五次。语音识别软件允许用户简单地说“打开记事本”，就可以打开程序，节省了时间，有时也改善了心情。语音理解（speechunderstanding）是指利用知识表达和组织等人工智能技术进行语句自动识别和语意理解。同语音识别的主要不同点是对语法和语义知识的充分利用程度。

11.6.2语音理解语音理解起源于美国，1971年，美国远景研究计划局（ARPA）资助了一个庞大的研究项目，该项目要达到的目标叫做语音理解系统。由于人对语音有广泛的知识，可以对要说的话有一定的预见性，所以人对语音具有感知和分析能力。依靠人对语言和谈论的内容所具有的广泛知识，利用知识提高计算机理解语言的能力，就是语音理解研究的核心。

11.6.2语音理解利用理解能力，可以使系统提高性能：①能排除噪声和嘈杂声；②能理解上下文的意思并能用它来纠正错误，澄清不确定的语义；③能够处理不合语法或不完整的语句。因此，研究语音理解的目的，可以说是与其研究系统仔细地去识别每一个单词，倒不如去研究系统能抓住说话的要旨更为有效。

11.6.2语音理解一个语音理解系统除了包括原语音识别所要求的部分之外，还须添入知识处理部分。知识处理包括知识的自动收集、知识库的形成，知识的推理与检验等。当然还希望能有自动地作知识修正的能力。因此语音理解可以认为是信号处理与知识处理结合的产物。语音知识包括音位知识、音变知识、韵律知识、词法知识、句法知识，语义知识以及语用知识。这些知识涉及实验语音学、汉语语法、自然语言理解、以及知识搜索等许多交叉学科。

11.6.3语音识别语音识别（speechrecognition）是指利用计算机自动对语音信号的音素、音

您可能关注的文档

文档评论（0）

duantoufa005 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

人工智能导论课件第11章第6-7节.pptx