多媒体应用技术4音频采集编辑合成语音识别研讨.pptVIP

下载本文档

5
0
约1.38千字
约 17页
2017-05-08 发布于湖北
举报

多媒体应用技术4音频采集编辑合成语音识别研讨.ppt

多媒体应用技术4音频采集编辑合成语音识别研讨

音频信息采集编辑音频采集噪音MIDI音乐语音识别技术语音合成技术降噪操作变速变调操作回声效果淡入淡出混音效果格式转换音频信息采集：方法： windows自带录音机进行采集 Audition软件录制手机录制噪音音高和音强变化混乱、听起来不谐和的声音是由发音体不规则的振动产生的，从物理学的角度来看：噪声是发声体做无规则振动时发出的声音。噪声的分类和产生白噪声是指一段声音中的频率分量的功率在整个可听范围（0～20KHZ）内都是均匀的。是一种无规噪声，瞬时值是随机变化的。具有连续的噪声谱，包含有各种频率成分的噪声。频率能量的分布是均匀的。噪声的分类和产生粉红噪声的频率分量功率主要分布在中低频段。在一定的范围内音频数据具有相同或类似的能量。噪声的分类和产生褐色噪声的频率分量功率主要集中在低频段。 MIDI乐器数字接口（Musical?Instrument?Digital?Interface）是一个工业标准的电子通信协定，为电子乐器等演奏设备（如合成器）定义各种音符或弹奏码，容许电子乐器、电脑、手机或其它的舞台演出设备彼此连接，调整和同步，得以实时交换演奏数据 Midi音乐的合成 MIDI产生的方法：频率调制合成法，波表合成法 MIDI播放的方法：计算机根据按键音量节奏等指令合成还原出乐器声音 MIDI音乐的特点：文件小，可编辑性强，处理语音的能力和效果差。 30min MIDI音乐 200k WAV音乐300M 3.6 语音识别技术 1. 语音识别的基本原理语音识别系统的实现主要分为三大阶段：连续语言信号的预处理特征提取模式匹配 2. 语音识别系统的类型 ⑴ 按照输入方式可分为三种：孤立字（词）、连接词以及连接语音的识别。 ⑵ 按照发音者可分为特定人、限定人和非特定人语音识别系统三种。 ⑶ 根据可识别的词汇量多少可分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。 3. 语音识别技术的应用 ⑴ 教育应用 ⑵ 信息处理与电子商务领域的应用 ⑶ 消费娱乐产品的应用 3. 常见语音识别技术百度：百度的语音识别技术研究项目，名为“Deep Speech”。据介绍，在噪音较大的背景下，百度语音识别技术的正确率高于谷歌10%。中国科技大学: 科大讯飞公司在语音识别技术上占有优势地位，该公司已经推出了成熟的语音输入法等产品。三星语音引擎 3.7 语音合成 3.7.1语音合成的概念语音合成包含两种可能实现的途径。一种是录音／重放模式，使机器再生一个预先存入的语音信号，采用数字存储技术。另一种可能是采用数字信号处理的方法。按照人类语言功能的不同层次，语音合成可分为三个层次：从文字到语音的合成从概念到语音的合成从意向到语音的合成语音数据的存储形式可分为两大类：波形存储参数存储 3.7.2文语转换技术语音合成系统包括三个主要的组成部分：文本分析模块：让计算机认识文字，和词语，进而知道怎么发音韵律生成模块：音节的声调、语气、停顿、发音长短声学模块：根据要求让计算机发声声音素材的基本操作实例 1.降噪处理 2.回声效果 3.变速变调效果 4. 拨号声效果 5. 混音效果 6. 淡入淡出效果 7. 音频文件的类型转换 *

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

多媒体应用技术4音频采集编辑合成语音识别研讨.pptVIP