4 语音识别.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4 语音识别.ppt

1.根据识别系统的类型选择能满足要求的一种识别方法,采用语音分析技术预先分析出这种方法所要求的语音特征参数,这些语音参数作为标准模式由计算机存储起来,形成标准模式库,称为模板。这个过程称为“学习”和“训练”。在某些识别系统中,还备有专家知识库,其中存放由语言学家的各种知识,如同音字判决规则、语法规则、语义规则等。 一、语音识别的步骤 2. 识别:将输入语音进行处理,提取特征参数,和模式库中的模板进行比较匹配,作出判决。 预处理 语音特征 参数分析 失真测度 计算 识别决策 标准 模板 专家 知识 模式匹配 语音识别的框图 语音信号的放大、防混叠滤波、自动增益控制、模数转换、消除噪声、端点检测。 二、预处理 端点检测:从包含语音的一段信号中确定出语音的起点和终点。有效的端点检测不仅能使处理的时间减到最小,而且能排除无声段的噪声干扰。实验表明:端点检测的正确与否影响到识别率的高低。语音端点检测的方法:短时能量和短时过零率。 特征参数和识别方法有关系,是语音识别的关键之处,选择的好坏直接影响语音识别的精度。 语音特征参数包括:短时平均能量、短时过零率、频谱、三个共振峰频率(F1、F2、F3的频率值、带宽、幅值)、线性预测系数、LPC倒谱和Mel倒谱等。 三、语音特征参数的提取 将未知语音的特征参数与模板参数逐一进行比较与匹配,判决的依据是失真测度最小的准则。 语音识别的测度有很多,欧氏距离测度及其变形、线性预测失真测度等。 四、模式匹配 欧氏距离测度 K维特征矢量: Xi={xi1 , xi2 , …… , xiK} Yj={yj1 , yj2 , …… , yjK} 均方误差欧氏距离 先对系统中的每个字,做一个码本作为该字的参考(标准)模板,共有M个字,故共有M个码本,组成一个模板库。 识别时,对于任意输入的语音特征矢量序列X={X1 , X2 , … , XN},计算该序列中每一个特征矢量对模板库中的每个码本的总平均失真量误差,找出最小的失真误差对应的码本(代表一个字),将对应的字输出作为识别的结果。 模式匹配过程 特征矢量序列 X={X1 , X2 , …… , XN} 模板库 Y1 , Y2 , …… , YM 特征矢量 序列形成 任意语音帧 X 码本 Y1 Y2 YM 计算 失真误差 判决 输出结果Yi 每一个字做一个码本,共M个字 模板库 {X1 , X2 , … , XN} 模板库 语 码本 {Y1 ,Y2 ,…,YN} 学 码本 音 码本 文 码本 wen 用来存储各种语言学知识,如汉语声调变调规则、音长分布规则、同音字判别规则、构词规则、语法规则、语义规则等。对于不同的语言有不同的语言学专家知识库。 专家知识库 判决是语音识别的最后一步,也是系统识别效果的最终表现。根据若干准则及专家知识,判决选出可能结果中最好的结果,由识别系统输出。 动态时间规整 一、动态时间规整的提出 二、动态时间规整的定义 三、动态时间规整的原理描述 四、动态时间规整的应用 一、动态时间规整的提出 语音信号具有很强的随机性,不同的发音习惯,发音时所处的环境不同,心情不同都会导致发音持续时间长短不一的现象。如单词最后的声音带上一些拖音,或者带上一点呼吸音,此时,由于拖音或呼吸音会被误认为一个音素,造成单词的端点检测不准,造成特征参数的变化,从而影响测度估计,降低识别率,因此在语音识别时,首先有必要对语音信号进行时间规整。 {X1 , X2 , … , XN} 模板库 语 码本 {Y1 ,Y2 ,…,YM} 学 码本 音 码本 文 码本 wen 特征矢量按发音的时间顺序提取 二、动态时间规整的定义 一次正确的发音应该包含构成该发音的全部音素以及正确的音素连接次序。 其中各音素持续时间的长短与音素本身以及讲话人的状况有关。为了提高识别率,克服发同一音而发音时间长短的不同,采用对输入语音信号进行伸长或缩短直到与标准模式的长度一致。这个过程称为时间规整。 说话人识别 一、定义 二、应用 三、特征选取 四、说话人识别的方法 语音识别系统的任务是准确地识别出全部话语或者理解所说的话语。 说话人识别系统的任务是确认说话人(即证实说话的人是否是所要求的那个人)或者从某个已知的人群集合中辨认出那个说话人。因此分为说话人确认和说话人辨认。主要用于身份的验证

文档评论(0)

cai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档