普通话检测技术2试题.ppt

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国石油大学信息与控制工程学院 中国石油大学信息与控制工程学院 中国石油大学信息与控制工程学院 普通话发音检测技术 自1203 黄林青 ·关于声音 声音的三要素 声音的三要素是音调、音色和音强 音调代表声音的高低,与频率有关。频率越高,音调越 高,反之亦然。 音色是声音的特色。影响声音特色的主要因素是复音,即具 有不同频率和不同振幅的混合声音。 音强是声音的强度,也被称为声音的响度。音强与声波的振 幅成正比,振幅越大,强度越大。 ·语音通信 人与人之间、人与机器之间的语音信息处理过程 人与人之间的语音通信 (人) 行 动 意 图 说话方 收听方 ○ 语言形成 发 音 收 听 认识 · 理解 传输系统 (编码、解码) 空间传播 文本解析 语音合成 语音识别 文章输入 (机器) 语音理解 计算机处理 应答文生成 Ⅰ:第一类人机 语音通信问题 Ⅱ:第二类人机 语音通信问题 Ⅰ Ⅱ ○ 计算机模拟人类交流信息的过程: (1) 将大脑产生的思想转换成语言 (2) 将语言转换成相应的语音 (3) 识别表达语言的语音内容 (4) 理解语音所表达的语言意义 自然语言生成 自然语言理解 语 音 合 成 语 音 识 别 ·主要运用的技术 ——语音识别技术 语音识别(Speech Recognition)主要指让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图。 语音识别是研究如何采用数字信号处理技术自动提取信号,是语音信号处理学科的一个分支。 语音识别的基本原理 随着世界范围内,越来越多的语音识别软件的涌现,如语音类搜索应用Dragon?Search、语音类听写功能整合软件讯飞口讯、语音类音乐软件Shazam、口语在线学习平台思必驰AIChinese,以及语音控制软件Siri等,语音识别势必会成为智能语音市场的主流。 计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚。在电子计算机和人工智能机器的广泛应用中。由于起步较早,发展较快,美国、日本等发达国家在机器人技术上已经很成熟,能实现人机自由对话,赋予机器以听觉,辨别话音的内容或者辨别说话人的身份,使机器能够按照人的意志进行各种操作。 ·国外的发展: ·国内的发展: 到70年代才由中科院声学所开始进行计算机语音识别的研究.80年代开始,很多学者和单位参与到语音识别的研究中来,80年代末,以汉语全音节识?别作为主攻方向的研究已经取得了相当大的进展,一些汉语语音输入系统已经向实用化迈进。在国家“863”计划的支持下,清华大学和中科院自动化所等单位在汉语听写机原理样机的研制方面开展了卓有成效的研究.但是,在实际应用中,噪声以及各种因素的影响,使语音识别系统的性能大幅度下降,很难达到让人满意的效果。 国内的发展瓶颈: ·连续语音的分割比较困难; ·每一个基本的声学识别基元(如音素)受前后音素发音方式的影响(协同发音)使特征变得不稳定 ·不同人、不同心理和生理以及在不同的说话环境下说同一词时,声学信号特征会发生变化; ·一个词的读音不仅包含了词义特征,而且还包含了说话人性别、年龄、情绪等大量与词义无关的信息,而这些信息的分离是不容易的。 ·自然语言的多变性难以借助于一些基本语法规则进行描述(如方言),因而使计算机编程变得困难。 语音识别基本原理中的相关概念 ·训练(Training):预先分析出语音特征参数,制作语音模板(Template)并存放在语音参数库中。 ·识别(Recognition):待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,得出识别结果。 ·失真测度(Distortion Measures):在进行比较时要有个标准,这就是计量语音特征参数矢量之间的“失真测度”。 ·主要识别框架:基于模式匹配的动态时间规整法(DTW:Dynamic Time Warping)和基于统计模型的隐马尔柯夫模型法(HMM:Hidden Markov Model)等。 ·构词规则 ·同音字判决 ·语法语义 ·背景知识 预处理 声学参数 分析 测度估计 失真测度 语音库 判决 专家知识库 训练 识别 结果 ·反混叠失真滤波器 ·预加重器 ·端点检测 ·噪声滤波器 ○ 语音信号 输入 语音识别的基本原理框图 应用:手机语音控制、普通话声控机器人 展望 语音识别技术是非常重要的人机交互技术,有着非常广泛的 应用领域和市场前景。应用语音的自动理解和翻译,可消除人类 相互交往的语言障碍。随着通信技术的飞速发展,语音识别技术 将

文档评论(0)

ccx55855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档