第5章-语音识别.pptxVIP

  • 1
  • 0
  • 约7.2千字
  • 约 49页
  • 2026-02-17 发布于江西
  • 举报

第五章语音识别

本章学习要点了解什么是语音识别了解语音识别的基本原理了解语音识别系统的组成掌握语音特征知识熟悉语音识别方法

目录5.1什么是语音识别5.2语音特征5.3语音识别方法

5.1什么是语音识别

5.1什么是语音识别语音识别,广义上来讲就是让计算机明白你说的话,具体来说是将人说出的话转换为文本的技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR)。语音识别一般和文字识别、人脸识别等技术一同被认为是模式识别的一个领域。

5.1什么是语音识别语音识别的基本原理语音识别的基本原理是让机器通过识别和理解过程把语音信号转变为相应的文本或命令,也就是让机器听懂人类的语音。例如,对于“nihao”,计算机识别成“你好”还是“尼浩”呢?

5.1什么是语音识别语音识别的基本原理语音识别技术是要识别每一个音的,所以需要将成段的语音分成若干小段。再将每个小段都识别成一个语音帧,再把这些帧根据声学特性组成声母和韵母,这就完成了我们语音识别的第一个阶段,也就是完成了识别“nihao”的过程。接下来,我们就要确定它到底是“你好”还是“尼浩”了。要完成这个过程,就需要通过语言表达规律即语言模型来判断最终的输出是符合我们预期的“你好”。

5.1什么是语音识别语音识别系统的组成及工作流程语音识别过程笼统来讲就是计算机采集人发出的声波转化为可以处理的数字信号,将其和人类语言划上等号。语音识别过程主要包括语音信号采集、语音信号预处理、语音信号的特征参数提取、向量量化、语音识别五个部分。

5.1什么是语音识别语音识别系统的组成及工作流程(1)语音信号的采集语音信号的采集过程就是将人类说话时发出的声音通过麦克风等设备转换成数字信号的过程。首先,麦克风接收到人类说话时发出的声音波,将声音波转换成电信号。接着,这个电信号经过模数转换器将其转换成数字信号。然后通过处理器进行处理和存储。最终,这些数字信号可以被传输到其他设备进行播放或分析。整个过程就是将声音转换成数字信号的过程。

5.1什么是语音识别语音识别系统的组成及工作流程(2)语音信号预处理语音识别的预处理过程是为了让计算机更好地理解和识别我们说话的内容。首先,采集到的语音信号会经过预处理,包括去除噪音和调整音量等操作,以确保语音信号的质量。接着,语音信号会被分割成小段,每一小段被称为一帧,这样可以更好地分析每一段语音的特征。然后,对每一帧语音进行特征提取,比如提取声音的频率、能量和声音强度等特征。最后,这些提取出来的特征会被送入模型进行识别,从而让计算机能够理解我们说的话。整个预处理过程就是为了让计算机更准确地识别和理解我们说话的内容。

5.1什么是语音识别语音识别系统的组成及工作流程(3)语音信号的特征参数提取当用麦克风这样的设备去收集声音时,实际上是在捕捉声音的波形。虽然这些波形包含了声音的所有信息,但光靠眼睛看是看不出什么的。所以,我们需要从这些采集到的数据中提取出有用的特征,这样计算机才能识别出我们说的是哪个词。

5.1什么是语音识别语音识别系统的组成及工作流程(3)语音信号的特征参数提取声波的采样数据可以绘制成一个平面图,x轴表示时间,y轴表示振幅。声波有两个主要特征:振幅和频率。为了能够看清楚声波中包含的主要频率波形,通常将采样信号经过傅里叶变换得到相应的频谱。再从频谱中看出波形中与不同音素匹配的主控频率组成成分。

5.1什么是语音识别语音识别系统的组成及工作流程(4)向量量化向量量化(VectorQuantization,VQ)技术是20世纪70年代后期发展起来的一种数据压缩和编码技术。向量量化就是把很多相关的数据打包在一起(比如一个人的语音特征),然后在更高维度的空间里进行分类,这样虽然丢失了一些细节信息,但可以大大减少我们需要处理的数据量。

5.1什么是语音识别语音识别系统的组成及工作流程(5)语音识别当收集了一堆语音特征后,就可以通过这些特征来判断说话人说了什么词。识别时用到的模型有隐马尔可夫模型、循环神经网络模型等。最终,这些被模型“理解”了的声音,变成了屏幕上一行行的文字,完成了从声波到意义的跨越。这不仅是一次技术的转换,更是人与机器间无声的对话,打开了无数沟通与创造的可能性。

5.2语音特征

5.2语音特征语音信号的数字化麦克风将这些空气中的振动巧妙地捕捉下来,然后通过物理原理将其转化为电信号。这样连续的声波就变成了电脑能读懂的离散的电信号,然后电脑就能识别并保存这个声音了。接下来的步骤就是将这些电信号转变成数字信号,这个过程称为模数转换(Analog-to-DigitalConversion,ADC)。这个过程主要包括采样、量化和编码这几个步骤。

5.2语音特征语音信号的数字

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档