人工智能_23. 语音识别的原理2.docxVIP

  • 1
  • 0
  • 约1.03千字
  • 约 3页
  • 2026-04-24 发布于广东
  • 举报

23:语音识别的原理

教师姓名

授课名称

人工智能及机器学习基础知识

授课形式

授课班级

授课地点

授课日期

章节名称

语音识别的原理

教学目的

掌握语音识别的基本原理

掌握语音识别的主要技术。

重点难点

重点:语音识别的基本原理。

难点:语音识别的技术。

主要内容

一、课程引入

让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。伴随着计算机技术的发展,语音识别在人机交互应用中逐渐进入我们日常的生活,已经成为人工智能领域的标志性技术之一。

语音识别技术以语音信号为研究对象,是语音信号处理的一个重要研究方向。其最终目标是实现人与机器进行自然语言通信。目前市场上也有很成熟的语音机器人。

课程内容

语音识别就转换为把这个矩阵转变为文本:

(1)音素:单词的发音由音素构成。对英语,一种常用的音素集是卡内基—梅隆大学的一套由39个音素构成的音素集(TheCMUPronouncingDictionary)。汉语一般直接用全部声母和韵母作为音素集。另外,汉语识别还分有音调和无音调。

(2)状态:比音素更细致的语音单位。

关系:若干帧语音对应一个状态,每三个状态组合成一个音素,若干个音素组合成一个单词。

语音识别具体是如何实现的呢?

其实就是下面的三个步骤:

(1)把帧识别成状态;

(2)把状态组合成音素;

(3)把音素组合成单词。

每个小竖条代表

文档评论(0)

1亿VIP精品文档

相关文档