- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《语音识别技术及应用》课程标准
【课程名称】语音识别技术及应用【课程编码】
【课程类别】专业必修课
【适用专业】人工智能技术应用专业
【授课单位】【总学时】36
【编写执笔人】【编写日期】
一、课程性质和课程设计
1.1课程制定依据
人工智能科技经过数十年的萌芽发展,如今成为了国家竞争力的重心之一。语音识别作
为人工智能的一个分支,也在飞速发展,占据国际语音方向一席之地。国家教育改革要求和
新一代人工智能发展规划,紧密跟随行业发展步伐,旨在培养具备专业知识与技能、实践能
力与创新精神的高素质技术技能人才。为满足社会对语音识别技术人才的广泛需求,以就业
导向为原则,为学生提供系统的知识体系,助力其在智能家居、智能交通、医疗健康等领域
脱颖而出,实现个人职业发展与国家人才培养目标的有机结合。
1.2课程性质与作用
《语音识别技术及应用》是人工智能技术应用专业的一门职业必修课,主要讲述语音处
理的基础知识和相关技术。学生通过学习本课程,能够增强信息意识、提升计算思维、促进
数字化创新与发展能力、树立正确的信息社会价值观和责任感,为其职业发展、终身学习和
服务社会奠定基础。
本课程着眼于学生的长远发展,重点培养其软件开发及人工智能领域岗位基本工作技能、
职业素养、社会适应能力、交流沟通能力、团队协作能力、创新能力和自主学习能力。
1.3课程设计思路
本课程教学采用理论与实践一体化的教学模式。教学内容设计由浅入深,使学生循序渐
进地掌握有关语音识别的基础理论知识、技术和方法。每一部分根据所学内容,教学形式为
理论+实践相结合,采用“做中学,学中做”的方法教学。教学过程中,充分开发学习资源,
给学生提供丰富的实践机会。教学效果评价采取过程评价与结果评价相结合的方式,通过理
论与实践相结合,培养和提高学生在多媒体信息处理方面的分析与解决问题的能力,为日后
从事相关领域的工程技术工作、科学研究以及开拓新技术领域,打下坚实的基础。
二、课程目标
2.1知识目标
(1)理解语音识别的概念。
(2)了解语音识别的应用领域和发展历程。
(3)掌握语音识别的主流框架。
(4)了解语音识别的常用语料库。
(5)了解常用的语音识别开发工具。
(6)了解语音特征的提取流程。
(7)理解预加重、分帧和加窗的基本原理及其实现方法。
(8)理解短时傅里叶变换的基本原理和实现方法。
(9)掌握语谱图特征的提取方法。
(10)掌握Fbank特征的提取方法。
(11)掌握MFCC特征的提取方法。
(12)了解隐马尔可夫模型的基本结构。
(13)理解隐马尔可夫模型的基本问题。
(14)掌握隐马尔可夫模型在语音识别中的应用方法。
(15)了解高斯混合模型的基本原理。
(16)理解高斯混合模型—隐马尔可夫模型的基本原理。
(17)掌握隐马尔可夫模型的编程实现方法。
(18)理解深度神经网络的基本原理。
(19)了解深度神经网络的常见结构。
(20)掌握构建深度神经网络相关函数的使用方法。
(21)理解深度神经网络—隐马尔可夫模型的工作原理。
(22)掌握深度神经网络—隐马尔可夫模型的训练流程。
(23)理解语言模型的基本概念。
(24)理解N-gram语言模型的基本原理。
(25)了解常用的平滑算法,包含拉普拉斯平滑、Good-Turing平滑、Katz平滑和
Kneser-Ney平滑。
(26)了解语言模型的评价指标。
(27)掌握N-gram语言模型的编程实现方法。
(28)理解循环神经网络语言模型的基本原理。
(29)掌握循环神经网络语言模型的编程实现方法。
(30)理解加权有限状态转换器的解码原理。
(31)理解端到端语音识别系统的工作流程。
(32)掌握连接时序分类模型的基本原理和训练方法。
(33)掌握连接时序分类模型
文档评论(0)