人工智能_23. 语音识别的原理2.docxVIP

人工智能_23. 语音识别的原理2.docx

23：语音识别的原理

教师姓名

授课名称

人工智能及机器学习基础知识

授课形式

授课班级

授课地点

授课日期

章节名称

语音识别的原理

教学目的

掌握语音识别的基本原理

掌握语音识别的主要技术。

重点难点

重点：语音识别的基本原理。

难点：语音识别的技术。

主要内容

一、课程引入

让机器听懂人类的语音，这是人们长期以来梦寐以求的事情。伴随着计算机技术的发展，语音识别在人机交互应用中逐渐进入我们日常的生活，已经成为人工智能领域的标志性技术之一。

语音识别技术以语音信号为研究对象，是语音信号处理的一个重要研究方向。其最终目标是实现人与机器进行自然语言通信。目前市场上也有很成熟的语音机器人。

课程内容

语音识别就转换为把这个矩阵转变为文本：

（1）音素：单词的发音由音素构成。对英语，一种常用的音素集是卡内基—梅隆大学的一套由39个音素构成的音素集（TheCMUPronouncingDictionary）。汉语一般直接用全部声母和韵母作为音素集。另外，汉语识别还分有音调和无音调。

（2）状态：比音素更细致的语音单位。

关系：若干帧语音对应一个状态，每三个状态组合成一个音素，若干个音素组合成一个单词。

语音识别具体是如何实现的呢？

其实就是下面的三个步骤：

（1）把帧识别成状态；

（2）把状态组合成音素；

（3）把音素组合成单词。

每个小竖条代表

更多 >