网站大量收购独家精品文档,联系QQ:2885784924

多媒体计算机技术 任正云 第3章 音频信息的获取与处理新.ppt

多媒体计算机技术 任正云 第3章 音频信息的获取与处理新.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 音频信息的获取与处理 3.1 信号处理的基本术语 采样与量化 采样长度的选择与频率分辨率 DFT和IDFT 小波变换 采样和量化 信号的数字化处理包括两个步骤,一个是信号在时间上的离散化,即采样;另一个是幅度上的离散化,即量化。 采样也称抽样,是信号在时间上的离散化,即按照一定时间间隔△t在模拟信号x(t)上逐点采取其瞬时值。它是通过采样脉冲和模拟信号相乘来实现的 采样和量化 量化是对幅值进行离散化,即将振动幅值用二进制量化电平来表示。量化电平按级数变化,实际的幅度值是连续的物理量。具体幅度值用舍入法归到靠近的量化电平上。 对模拟信号采样首先要确定采样间隔。如何合理选择△t涉及到许多需要考虑的技术因素。 采样定理 采样长度的选择与频率分辨率 DFT和IDFT 傅立叶分析是将原始信号分解成不同频率成分的正弦波,将时域信号转变为频域信号的一种数学方法,在信号的分析和处理中有着十分重要的作用 对数字信号,需要采用相关的离散化方法,这就是由傅立叶分析得到的离散傅立叶变换DFT,其逆变换表示为IDFT。 DFT和IDFT 设是连续函数h(t)的N个采样值,则这N个点的宽度为N的DFT定义为 IDFT定义为 称为N点DFT的变换核函数 称为N点IDFT的变换核函数 小波变换 一个小波是一个在有限周期内的波形,它的平均值为零。 比较正弦波形和小波,正弦信号正是Fourier分析的基础,它没有限定的周期,它可以从负无穷扩展到正无穷,正弦信号是平滑并且是可预知的,小波信号是不规则的并且不对称。 小波变换 傅立叶分析是将信号分解为各种频率的正弦信号,类似地,小波分析是将信号分解为滑动的、与母系小波成比例的各种子波。 小波变换 小波变换可以使得信号的低频长时特性和高频短时特性同时得到处理,具有良好的局部化性质,能有效地克服傅氏变换在处理非平稳复杂信号时存在的局限性,具有极强的自适应性。 由于小波变换能够有效地解决方块效应和基本上解决蚊式噪声,所以小波变换已经成为当今图像压缩编码的主要研究方向。 数字音频基础 模拟音频和数字音频 音频信号的特点 3D音频 随着软、硬件的不断发展,传统的双声道单层面立体声音场,已经不能满足人们的需要。为了得到更好的立体感受和空间感受,科学家借助数字化音频生成了一种全新的声音----模拟3D音频。 声卡的组成与工作原理 声卡的分类 声卡的组成和布局 声卡的组成 声卡的工作原理 音频卡的工作原理的主要组成部分 SPDIF数字音频接口 SPDIF在多媒体声卡上应用的优势和不足 音频卡的发展和改进 音频编码基础和标准 频域信息的冗余度 人的听觉感知机理 音频编码的分类 音频编码标准 G.711 本建议公布于1972年,它给出话音信号编码的推荐特性。话音的取样率为8 kHz,允许偏差是±50×10-6。每个样值采用8位二进制编码,推荐使用A律和μ律编码。本建议中分别给出了A律和μ律的定义,它是将13位的PCM按A律、14位PCM按μ律转换为8位编码。主要用于公共电话网中。 G.721 G.722 G.722建议的宽带音频压缩仍采用波形编码技术,因为要保证既能适用于话音,又能用于其他方式的音频,只能考虑波形编码。G.722编码采用了高低两个子带内的ADPCM方案,高低子带的划分以4 kHz为界,然后再对每个子带内采用类似G.721建议的ADPCM编码,因此G.722建议的技术方案可以简写为SB-ADPCM(子带—自适应差分脉冲码调制)。 G.728 为了进一步降低压缩的速率,CCITT于1992年制定了G.728标准,使用基于低时延码本激励线性预测编码(LD-CELP)算法,其速率为16kb/s,主要用于公共电话网中。 MPEG音频编码标准 MPEG音频编码标准具有可伸缩性,根据采用的压缩因子的不同可以获得不同的音质。 MPEG采用分层编码方式,其层次与压缩因子的关系如下表所示 MP3 MP4压缩技术 MP4最初是一种音频格式,使用的是MPEG-2AAC(Advanced Audio Coding,先进音频编码)技术。它的特点是音质更加完美而压缩比更大(15:1~20:1)。MPEG-2AAC在采样频率为8~96kHz时可提供1~48个声道可选范围的高质量音频编码。 AAC适用于从比特率为8kb/s单声道的电话语音音质到160kb/s多声道超高质量音频信号范围内的编码,并且允许对多媒体进行编码/解码,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪等MP3没有的特性,使得在音频压缩后仍能完美的再现CD的音质。 MP4的特点 MP4除了采用了先进

文档评论(0)

精品课件 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档