- 1、本文档共89页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章数字音频处理第二次课.ppt
第2章 数字音频处理 本章重点: 模拟音频与数字音频的概念 数字音频的获取 音频信号压缩编码标准 音乐合成和语音识别 第2章 数字音频处理 2.1概述 2.2数字音频的获取 2.3音频信号压缩编码标准 2.4音乐合成和MIDI 2.5语音识别 2.6实例 VC++播放声音的实现 2.7本章小结 2.1概述 声音是携带信息的重要媒体。研究表明,人类从外部世界获取的信息中,10%是通过听觉获得的,因此声音是多媒体技术研究中的一个重要内容。 声音是由物体振动产生的,这种振动引起周围空气压强的振荡,从而使耳朵产生听觉的印象。 声音的种类繁多,人的语音是最重要的声音。此外,还有动物、乐器等发出的声音,风声、雨声、雷声等自然声音,以及机器合成产生的声音等。 2.1概述 2.1概述 声音包含三个要素:音调、音强和音色。 基频与音调:一个声源每秒钟可产生成百上 千个波,通常把每秒钟波峰所产生的数目称之为 信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表 示。 人对声音频率的感觉表现为音调的高低,在 音乐中称为音高。音调正是由频率ω所决定的。 2.1概述 音乐中音阶的划分是在频率的对数坐标 (20×log)上取等分而得的。如表所示, 20×log261=48.3,20×log293=49.3等。 2.1概述 谐波与音色:n×ωo称为基波ωo的n次谐波分量 (n就是高次谐波的方次,n× ωo就是基波ωo的n次 谐波),也称为泛音。音色是由混入基音的泛音所决 定的 。 幅度与音强:信号的幅度是从信号的基线到当前波 峰的距离。幅度决定了信号音量的强弱程度。幅度越 大,声音越强。一般用动态范围定义相对强度: 动态范围=20×log(信号的最大强度/信号的最小强度) (dB) 2.1概述 音宽与频带:频带宽度,也称为带宽,它是描 述组成复合信号的频率范围。 客观上,通常用频带宽度、动态范围、信噪比 等指标衡量音频信号的质量。音频信号的频带越 宽,所包含的音频信号分量越丰富,音质越好。 动态范围越大,信号强度的相对变化范围越大, 音响效果越好。 2.1概述 声音的质量可以通过信噪比来度量。信噪比 (SNR,Signal to Noise Ratio)是有用信号与噪声 之比的简称,定义为: 信噪比越大,声音质量越好。 2.2数字音频的获取 2.2.1采样 2.2.2量化 2.2.3数字音频的技术指标 2.2.4数字音频的文件格式 2.2.1采样 2.2.1采样 采样时间间隔称为采样周期t,其倒数为采样频 率fs=1/t。一般来讲,采样频率越高,则在单位时 间内计算机得到的声音样本数据就越多,对声音 波形的表示也越精确,声音失真越小,但用于存 储音频的数据量越大。 根据奈奎斯特定理,只有采样频率高于声音信 号最高频率的两倍时,才能把数字信号表示的声 音还原为原来的声音。 2.2.2量化 每个采样值在幅度上进行离散化处理的过程称 为量化 。 量化可分为均匀量化和非均匀量化。均匀量化 是把将采样后的信号按整个声波的幅度等间隔分 成有限个区段,把落入某个区段内的样值归为一 类,并赋于相同的量化值。以8bit或16bit的方式来 划分纵轴为例,其纵轴将会被划分为28个和216个 量化等级,用以记录其幅度大小。 2.2.2量化 非均匀量化是根据信号的不同区间来确定量化 间隔。对于信号值小的区间,其量化间隔也小; 反之,量化间隔就大。 量化会引入失真,并且量化失真是一种不可逆 失真,这就是通常所说的量化噪声。 模拟信号经过采样和量化,形成一系列离散信号。这种数字信号可以以一定方式进行编码,形成计算机内部存储运行的数据,经过编码后的声音信号就是数字音频信号。 2.2.3数字音频的技术指标 衡量数字音频的主要指标包括: 采样频率 量化位数 通道(声道)个数 数据传输率是计算机处理时基本参数。未经压 缩的数字音频数据传输率可按下式计算: 数据传输率=采样频率×量化位数×声道数 2.2.3数字音频的技术指标 例:假定语音信号的带宽是50 Hz—10kHz,而音乐信号的是 15Hz —20 kHz。采用奈奎斯特频率,并用12bit表示语音信 号样值,用16bit表示音乐信号样值,计算这两种信号数字化 以后的比特率以及存储一段10分钟的立体声音乐所需要的存 储器容量。 解:语音信号:取样频率=2×10kHz=20kHz; 比特率=20k×12=240 kbit/s 音乐信号:取样频率=2×20kHz=40kHz; 比特率
您可能关注的文档
- 病性辩证w1.ppt
- 第1章电路分析基础张永瑞第三版.ppt
- 微机课件05第五章:内存储器和存储体系.ppt
- 第1章摩擦轮传动带传动.ppt
- 相对论大学物理.ppt
- 石灰桩处理.ppt
- 第1章数据库基础知识新.ppt
- 第2章电磁辐射与地物光谱特征1090921.ppt
- 离散时间信号—序列.ppt
- 五2数学课件-通分-陈琢.ppt
- 2024-2025学年安徽省亳州市涡阳县高二下学期2月开学考试政治试题(解析版).docx
- 2024-2025学年江西省赣州市上犹县高二下学期开学考试政治试题(解析版).docx
- 2024-2025学年山东省济宁市高二下学期开学考试政治试题(解析版).docx
- 2024-2025学年山西省卓越联盟高三下学期2月开学质量检测政治试题(解析版).docx
- 2024-2025学年新疆乌鲁木齐市高二下学期2月开学考试政治试题(解析版).docx
- 2024-2025学年新疆维吾尔自治区乌鲁木齐地区高三2月大联考文科综合政治试题(解析版).docx
- 2024-2025学年安徽省蚌埠市固镇县高一上学期1月期末考试政治试题 (解析版).docx
- 2024-2025学年江苏省扬州市高三上学期期末检测政治试卷(解析版).docx
- 2024-2025学年江西省吉安市高三上学期期末教学质量检测政治试题(解析版).docx
- 2024-2025学年山东省济宁市高二上学期1月期末考试政治试题(解析版).docx
文档评论(0)