- 1、本文档共128页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 数字音频处理 多媒体技术 ppt 课件
第2章 数字音频处理 本章重点: 模拟音频与数字音频的概念 数字音频的获取 音频信号压缩编码 音乐合成和语音识别 第2章 数字音频处理 2.1概述 2.2数字音频的获取 2.3音频信号压缩编码 2.4音乐合成和MIDI 2.5语音识别 2.6实例 VC++播放声音的实现 2.7本章小结 2.1概述 声音是携带信息的重要媒体。研究表明,人类从外部世界获取的信息中,10%是通过听觉获得的,因此声音是多媒体技术研究中的一个重要内容。 2.1概述 声音是由物体振动产生的,这种振动引起周围空气压强的振荡,从而使耳朵产生听觉的印象。 2.1概述 超声波的应用 (1)利用超声波的巨大能量还可以把人体内的结石击碎. (2)清理金属零件、玻璃和陶瓷制品的除垢是件麻烦事.如果在放有这些物品的清洗液中通入超声波,清洗液的剧烈振动冲击物品上的污垢,能够很快清洗干净. (3)用超声波探测金属、陶瓷混凝土制品,甚至水库大坝,检查内部是否有气泡、空洞和裂纹 (4)人体各个内脏的表面对超声波的反射能力是不同的,健康内脏和病变内脏的反射能力也不一样.平常说的“B超”就是根据内脏反射的超声波进行造影,帮助医生分析体内的病变. 2.1概述 音频信号所携带的信息大体上可分为语音、音 乐和音效三类。 语音,指具有语言内涵和人类约定俗成的特殊 媒体 。 音乐,指规范的符号化了的声音 。 音效,指人类熟悉的其他声音。 在多媒体系统中,处理的信号主要是音频信 号。 2.1概述 声音包含三个要素:音调、音强和音色。 基频与音调:一个声源每秒钟可产生成百上 千个波,通常把每秒钟波峰所产生的数目称之为 信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表 示。 人对声音频率的感觉表现为音调的高低,在 音乐中称为音高。音调正是由频率ω所决定的。 2.1概述 音乐中音阶的划分是在频率的对数坐标 (20×log)上取等分而得的。如表所示, 20×log261=48.3,20×log293=49.3等。 2.1概述 谐波与音色:n×ωo称为基波ωo的n次谐波分量 (n就是高次谐波的方次,n×ωo就是基波ωo的n次 谐波),也称为泛音。音色是由混入基音的泛音所决 定的 。 幅度与音强:信号的幅度是从信号的基线到当前波 峰的距离。幅度决定了信号音量的强弱程度。幅度越 大,声音越强。一般用动态范围定义相对强度: 动态范围=20×log(信号的最大强度/信号的最小强度) (dB) 2.1概述 音宽与频带:频带宽度,也称为带宽,它是描 述组成复合信号的频率范围。 客观上,通常用频带宽度、动态范围、信噪比 等指标衡量音频信号的质量。音频信号的频带越 宽,所包含的音频信号分量越丰富,音质越好。 动态范围越大,信号强度的相对变化范围越大, 音响效果越好。 2.1概述 声音的质量可以通过信噪比来度量。信噪比 (SNR,Signal to Noise Ratio)是有用信号与噪声 之比的简称,定义为: 信噪比越大,声音质量越好。 2.2数字音频的获取 2.2.1采样 2.2.2量化 2.2.3数字音频的技术指标 2.2.4数字音频的文件格式 2.2.1采样 2.2.1采样 采样时间间隔称为采样周期t,其倒数为采样频 率fs=1/t。一般来讲,采样频率越高,则在单位时 间内计算机得到的声音样本数据就越多,对声音 波形的表示也越精确,声音失真越小,但用于存 储音频的数据量越大。 采样定理(奈奎斯特定理) 设连续信号 x(t) 的频谱为 x(f), 以采样间隔 T 采样得到离散信号 x(nT),若满足: T ≤ ── (fc是信号的高端截止频率) 则可以由离散信号 x(nT) 完全确定连续信号 x(t)。 更通俗地讲: 只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原为原来的声音。奈奎斯特采样定理用公式表示为: ,其中, 为声音信号的最高频率。 举例: (1)在数字电话系统中,由于电话语音的最高信号频率约为3.4KHz,为将人的声音变为数字信号,电话语音采样频率不低于6.8kHz,通常选为8kHz。 (2)要想获得CD音质的效果,则要保证采样频率为44.1kHz,也就是能够捕获频率高达22050Hz的信号。 说明:因为人耳能够听见的最高声音频率为20kHz,为了避免高于20kHz的高频信号干扰采样,在进行采样之前,需要对输入的声音信号进行滤波。考虑到滤波器在20kHz处大约有10
您可能关注的文档
- 第1篇 工程材料导论.ppt
- 第1篇--第1章 网络配置、管理与应用 网络管理与应用 教学课件.ppt
- 第1编 社会保障法 保障法 教学课件.ppt
- 第1章:什么是心理学 心理学与生活 教学课件.ppt
- 第1篇 直流电机(DC MACHINES) 电机学课件.ppt
- 第1讲 命题逻辑基础 北京大学计算机系离散数学讲义(ppt版).ppt
- 第1讲 EDA技术概述 EDA课件.ppt
- 第1讲 C语言程序设计概述 C语言课件.ppt
- 第1篇 电力电子开关器件和辅助电路 工学硕士电力电子技术课件.ppt
- 第1讲 《Altium概述》 《Altium Designer winter 09电路设计案例教程》 电子教案 教学课件.ppt
文档评论(0)