- 0
- 0
- 约1.01千字
- 约 3页
- 2026-04-24 发布于广东
- 举报
22:语音识别的原理
教师姓名
授课名称
人工智能及机器学习基础知识
授课形式
授课班级
授课地点
授课日期
章节名称
语音识别的原理
教学目的
掌握语音识别的基本原理
掌握语音识别的主要技术。
重点难点
重点:语音识别的基本原理。
难点:语音识别的技术。
主要内容
一、课程引入
让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。伴随着计算机技术的发展,语音识别在人机交互应用中逐渐进入我们日常的生活,已经成为人工智能领域的标志性技术之一。
语音识别技术以语音信号为研究对象,是语音信号处理的一个重要研究方向。其最终目标是实现人与机器进行自然语言通信。目前市场上也有很成熟的语音机器人。
课程内容
声音实际上是一种波,俗称声波。常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如WindowsPCM文件,也就是俗称的wav文件。wav文件里存储的除了一个文件头之外,就是声音波形的一个一个点了。
在开始语音识别之前,有时需要把首尾端的静音切除,降低对后续步骤造成的干扰。这个静音切除的操作一般称为VAD,需要用到信号处理的一些技术。
要对声音进行分析,需要对声音分帧,也就是把声音切开成一小段一小段,每小段称为一帧。
分帧操作一般不是简单的切开,而是使用移动窗函数来实现。
帧与帧之间一般是有交叠的,如上图所示。每帧的长
您可能关注的文档
- 人工智能_3. 人工智能的定义.docx
- 人工智能_29. 智能问答.docx
- 人工智能_4. 人工智能研究的主要内容.docx
- 液压与气动_直动式减压阀结构和工作原理.pptx
- 城市轨道交通客运组织_19.移动平均法.pptx
- 液压与气动_7、增加缸、伸缩缸、齿轮齿条缸.pptx
- 城市轨道交通客运组织_20.回归分析法.pptx
- 液压与气动_液压回路.pptx
- 微信小程序课程_微信小程序课程第一次大作业 2.docx
- 液压与气动_5气动-流量控制阀.pptx
- (2026年)《内蒙古自治区实施《中华人民共和国乡村振兴促进法》办法》学习与解读.pptx
- (2026年)《中华人民共和国民族团结进步促进法》培训.pptx
- (2026年)《重庆市规范性文件管理条例》培训(2026年6月1日施行).pptx
- (2026年)《中华人民共和国民用航空法》学习与解读.pptx
- (2026年)《北京市无人驾驶航空器管理规定》学习与解读 (1).pptx
- (2026年)《包头市市政设施管理条例》学习与解读.pptx
- (2026年)《创伤失血性休克诊治中国急诊专家共识(2023)》.pptx
- (2026年)《低钠血症中国专家共识(2026版)》学习与解读.pptx
- (2026年)《肝门部胆管癌:米兰专家共识》解读.pptx
- (2026年)《供水条例》学习与解读(2026年6月1日施行).pptx
原创力文档

文档评论(0)