第二篇 音频信息处理ver3.0.ppt

  1. 1、本文档共127页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 音频信息处理 多媒体技术的特点是交互式地综合处理声文图信息。在多媒体系统中语音和音乐是不可少的。没有音频的视频是不可接受的。音频和视频同步,才能使视频图像更具真实性。娓娓动听的音乐和解说,会使静态图像变得更加丰富多彩。可视电话、电视会议中的声音更为重要。 第二章音频信息处理 2.1 声音概述 2.2 音频信息数字化 2.3 音频文件的格式 2.4 语音压缩编码 2.5 音乐合成和MIDI 2.1 声音概述 一、声音及其分类 1、声音 声音是通过空气传播的一种连续的波,称为声波。 基本参数 频率:声音的频率,体现音调的高低 振幅:声波压力的大小,体现声音的强弱 2.1 声音概述 声音信号由许多频率不同的信号组成,是复合信号。 重要参数-带宽:复合信号的频率范围 例如:高保真(high-fidelityaudio)声音的频率范围为10Hz~20000Hz,其带宽约为20KHz。而视频信号的带宽是6MHz。 2.1 声音概述 2、声音的分类 声音:无规则的噪音和有规则的音频信号。 音频信号携带的信息可分为:语言、音乐和音效等三类。 2.1 声音概述 3、声音的三要素 音调、音色和音强是声音的三要素。 在任一时刻,模拟声波信号曲线都可以分解为一系列正弦波的线性叠加。 其中ω0称为基频或基音(最低的音波); n*ω0称为ω0的n次谐波分量或称为泛音,其频率是基频 的整数倍。 2.1 声音概述 ⑴ 音调 在音乐中称为音高,音高是指声波的基频。将基频取对数后与人的音高感觉成线性关系,音律中最常见的12平均律中的音阶划分,就是在频率对数坐标取等分而得来的。 ⑵ 音色 取决于声波的频谱,即由混入基音的泛音所决定的。各阶谐波即泛音的幅度比例不同,随时间衰减的程度不同,则音色就不同。若中高频泛音丰富,音色就明亮,如小号;若低频泛音丰富,音色就低沉,如低音贝司。 2.1 声音概述 ⑶ 音强 取决于声波信号的强弱程度,即与声音信号的幅度成正比。人耳在辨别声音的能力只有在音强适中时才最灵敏。 由于人的听觉响应与声音信号强度不是成线性关系,因此一般用声音信号幅度取对数后再乘20所得值来描述声强,以分贝(dB)为单位,此时称为音量。在处理音频信号时,一般用动态范围来定义音频信号的相对强度: 动态范围=20×log(信号的最大强度/信号最小强度) 单位:dB 2.1 声音概述 二、音频信号 (1)语音:具有语言内涵和人类约定成俗的特殊媒体。 (2)音乐:规范的符号化了的声音。 (3)音效(响):人类熟悉的其他声音,如动物发声、机器产生的声音、自然界的风雨雷电声等。 音频的作用:直接通过讲话表达信息、制造某种效果和气氛、演奏音乐等。 2.1 声音概述 1、 音频——人类听觉所感知范围内的频率,也称声频。 音频(Audio):频率范围是20Hz~20KHz的声音信号(人耳能听到) 次声波(subsonic):频率低于20Hz的信号(亚音) 超声波(ultrasonic):频率高于20KHz的信号(超音频) 说明1: 次声波和超声波之间的音频为可听声波,属于多媒体音频信息范畴。 2.1 声音概述 说明2: 人的发音器官发出的声音频率大约是80~3400Hz,但人说话的信号频率通常为300~3000Hz,人们把在这种频率范围的信号称为语(话)音(speech)信号; 实际上,人最敏感的频率范围是3KHz~5KHz。对于高于18~20kHz和低于16~20Hz的声音信号,无论音强如何,一般人都听不到。 2.1 声音概述 2、音频信号——用电压或电流模拟信号表示声音信号,在多媒体技术中采用的是数字化音频信息。 3、音频信息处理技术 (1)音频获取技术(语音的采集、识别和理解) (2)音频合成技术(音乐的合成和语音的合成) (3)音频定位技术(模拟立体声、音频/视频同步) (4)音频编码、解码技术 (5)音频网络传输技术 2.1 声音概述 4、音频信号的技术指标 ⑴ 频带宽度:音频信号的频率范围,是衡量音质的标准。 频带越宽,包含的音频信号分量越丰富,则音质越好。 通常将音质定义为4个等级标准: CD-DA唱盘为10Hz~22KHz; FM广播为20Hz~15KHz; AM广播为50Hz~7KHz; 数字电话为200Hz~3.4KHz。 2.1 声音概述 2.1 声音概述 ⑵ 动态范围 动态范围=20×log(信号的最大强度/信号的最小强度) 动态范围越大,说明音频信号的相对变化范围大,音响效果越好。 2.1 声

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档