《数字信号处理》语音识别系列实验.doc

《数字信号处理》语音识别系列实验.doc

《数字信号处理》语音识别系列实验 引言: 语言是人类最重要的交流工具,自动语音识别技术起源于20世纪50年代,最早的商用系统是IBM在90年代推出的ViaVoice。经过半个多世纪的发展,语音识别技术目前已日趋成熟并成功应用到人们的日常生活之中,如苹果手机的Siri体验、科大讯飞的迅速崛起等。 语音是一种典型的、易于获取的一维时序信号,语音识别技术也是数字信号处理课程绝佳的实践途径。时间序列分析、快速傅里叶变换、滤波器设计等多项数字信号处理的教学内容在语音识别核心技术中均占有重要地位。本系列实验即面向语音识别基本任务,由浅入深,循序渐进地设计完善语音识别系统,包括时域法、频域法、说话人识别三个具体实验。 实验1 基于时域分析技术的语音识别 实验目的:熟悉语音数据的基本形式及特点,理解并应用离散时间信号的基本分析、处理方法,理解语音识别技术的概貌,为后续实验打好基础。 实验原理及要点: 语音信号的采集: 采集“0”、“1”、…、“9”这10个语音的wav文件,每个类别应采集10组以上的样本。可以通过Windows的录音机等应用软件来实现,也可以借助语音处理的API函数,通过编程的方式来实现。 图1. Windows的录音机。 语音信号格式的理解: 通过互联网调研wav文件的具体格式,找到并理解其中与本任务密切相关的字段,如采样率等,能够编程实现对其中语音数据字段的读取

文档评论(0)

1亿VIP精品文档

相关文档