2025年语音识别技术的应用及发展.pdfVIP

  • 0
  • 0
  • 约5.66千字
  • 约 9页
  • 2025-10-21 发布于河南
  • 举报

操千曲尔后晓声,观千剑尔后识器。——刘勰

语音识别技术的应用及发展

博观而约取,厚积而薄发。——苏轼

语音识别技术的应用及发展

语音识别是以语音为研究对象,通过语音信号处理和模式识

别让机器自动识别和理解人类口述的语言。语音识别技术就是让

机器通过识别和理解过程把语音信号转变为相应的文本或命令

的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、

语音学、语言学、信息理论、模式识别理论以及神经生物学等学

科都有非常密切的关系。语音识别技术正逐步成为计算机信息处

理技术中的关键技术,语音技术的应用已经成为一个具有竞争性

的新兴高技术产业。

1、语音识别的基本原理

语音识别系统本质上是一种模式识别系统,包括特征提取、

模式匹配、参考模式库等三个基本单元,它的基本结构如下图所

示:

未知语音经过话筒变换成电信号后加在识别系统的输入端,

首先经过预处理,再根据人的语音特点建立语音模型,对输入的

语音信号进行分析,并抽取所需的特征,在此基础上建立语音识

别所需的模板。而计算机在识别过程中要根据语音识别的模型,

志不强者智不达,言不信者行不果。——墨翟

将计算机中存放的语音模板与输入的语音信号的特征进行比较,

根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配

的模板。然后根据此模板的定义,通过查表就可以给出计算机的

识别结果。显然,这种最优的结果与特征的选择、语音模型的好

坏、模板是否准确都有直接的关系。

2、语音识别技术的发展历史及现状

1952年,ATTBell实验室的Davis等人研制了第一个可

十个英文数字的特定人语音增强系统一Audry系统1956年,

美国普林斯顿大学RCA实验室的Olson和Belar等人研制出能

10个单音节词的系统,该系统采用带通滤波器组获得的频谱参

数作为语音增强特征。1959年,Fry和Denes等人尝试构建

音素器来4个元音和9个辅音,并采用频谱分析和模式匹配进

行决策。这就大大提高了语音识别的效率和准确度。从此计算机

语音识别的受到了各国科研人员的重视并开始进入语音识别的

研究。60年代,苏联的Matin等提出了语音结束点的端点检测,

使语音识别水平明显上升;Vintsyuk提出了动态编程,这一提

法在以后的识别中不可或缺。60年代末、70年代初的重要成果

是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)

技术,有效地解决了语音信号的特征提取和不等长语音匹配问

题;同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。

语音识别技术与语音合成技术结合使人们能够摆脱键盘的束缚,

操千曲尔后晓声,观千剑尔后识器。——刘勰

取而代之的是以语音输入这样便于使用的、自然的、人性化的输

入方式,它正逐步成为信息技术中人机接口的关键技术。

、语音识别的方法3

目前具有代表性的语音识别方法主要有动态时间规整技术

(DTW)、隐马尔可夫模型(HMM)、矢量量化(VQ)、人

工神经网络(ANN)、支持向量机(SVM)等方法。

动态时间规整算法(DynamicTimeWarping

文档评论(0)

1亿VIP精品文档

相关文档