语音识别06课件讲解.pptxVIP

  • 0
  • 0
  • 约1.8千字
  • 约 23页
  • 2026-01-15 发布于陕西
  • 举报

语音识别主讲人:孟凡朕

CONTENTS目录01语音识别02语音识别的应用技术

学习目标理解语音识别的算法原理掌握语音识别算法的优缺点和适用场景熟练运用语音识别算法解决问题

01 语音识别K-means矢量量化算法创建k个点作为起始质心(通常是随机选择),当任意一个点的簇分配结果发生改变时(不改变时算法结束)。对数据集中的每个数据点,对每个质心,计算质心与数据点之间的距离,将数据点分配到距其最近的簇,对每一个簇,计算簇中所有点的均值并将均值作为质心。

01 语音识别LBG算法(1)初始化(2)分裂(3)K-means(4)结束

01 语音识别动态时间归正的识别技术DTW(DynamicTimeWarping)是一种模板匹配技术,是基于相似度计算与匹配实现的识别方法。 (1)计算两个标量的相似度。 (2)计算两个矢量的相似度。 (3)经过预处理和特征提取后的语音可以看做矢量的序列

01 语音识别动态时间归正的识别技术每一条从(1,1)倒(M1,M2)路径都有一个累计距离称为路径的代价。每一条路径都代表一种对齐情况。代价最小的路径就是所求对准路径。如何对准

01 语音识别动态时间归正的识别技术DTW路径搜索算法(1)初始化其约束区域Reg可以假定是一个平行四边形,其两个顶点位于起始点和重点,相邻两条边的斜率分别为2和1/2。

01 语音识别动态时间归正的识别技术递推求累计距离并记录回溯信息

01 语音识别动态时间归正的识别技术回溯求出所有的匹配点对:根据每步的上一步最佳局部路径p(i,j),由匹配点(M1,M2)对向前回溯一直到(1,1)。这个回溯过程对于求平均模板或聚类中心来讲是必不可少的,但在识别过程往往不必进行。

01 语音识别连续词语的识别技术语音识别研究中意义最重大、应用成果最丰富,同时最具有挑战性的研究课题。大词汇量非特定人的连续语音识别系统的词误识率大体为小词汇量、特定人的孤立词识别系统词误识率的50倍左右。特有的问题: (1)词(模式)的数量太多,语料不够。 (2)发音相近的内容多,误识严重。

01 语音识别连续词语的识别技术虽然进行大词汇量连续语音识别面临各种困难,但在上个世纪90年代初期它已经取得了若干突破性的进展。基于HMM的LVCSR系统的统一框架,将整个识别系统分为三层:声学—语音层、词层和句法层。声学—语音层是识别系统的底层,它接受输入语音,并以一种“子词(Subword)”单位作为其识别输出每个子词单位对应一套HMM结构和参数。词层规定词汇表中每个词是由什么音素—音子串接而成的句法层中规定词按照什么规则组合成句子。

01 语音识别连续词语的识别技术

01 语音识别 连续词语的识别技术

CONTENTS目录01语音识别02语音识别的应用技术

学习目标了解语音识别的应用场景掌握各个场景下语音技术的差异

02 语音识别的应用技术语音信息检索(1)直接对音频信息进行分类(2)基于内容的音频检索(3)为视频分类而做的音频分析和检索(4)视频检索

02 语音识别的应用技术发音学习技术发音学习技术主要集中在三个方面:(1)寻找反应发音质量的性能指标,主要是研究如何对声调、重音、语速和韵律等指标进行计算;(2)对词、短语、句子发音进行打分,检测和纠正给定的音素级发音错误;(3)与人工判断进行相比较,研究计算机辅助发音学习系统的性能评测手段。

02 语音识别的应用技术发音学习技术(1)语料库的建立 (2)分级标准(3)语音对齐 (4)自动发音打分 (5)发音矫正 (6)性能评测

02 语音识别的应用技术基于语音的情感处理(1)情感类型的划分(2)情感语音数据的获取(3)相应的支撑技术(4)情感分析(5)情感识别(6)情感和成

02 语音识别的应用技术网络环境下语音识别(1)声码器损失的克服 (2)丢包损失的克服

02 语音识别的应用技术嵌入式语音识别技术嵌入式语音识别技术主要指的是各种先进的微处理器在版级或是芯片级用。软件或硬件实现语音识别技术。常用的识别方法有DTW或HMM。

感谢观看THANGKS!

文档评论(0)

1亿VIP精品文档

相关文档