多媒體技术音频处理技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒體技术音频处理技术

第二章 音频信息处理 ; 第2章 音频信息处理 ;2.1数字音频的基本概念;2、声音的分类 按频率分 亚音频: 0~20Hz 音频(Audio):20Hz~20KHz 超音频: 20KHz~1GHz 过音频: 1GHz~1THz ;按原始声源划分 语音:人类为表达思想和感情发出的声音 乐音:演奏乐器时乐器发出的声音 声响:除语音和乐音以外的所有声音。如自然界的声音 ;按存储形式划分 模拟声音:模拟方式存储,如磁带 数字声音:用0、1表示的声音数据;;4、声音质量的评价标准(信噪比、频带宽度) 按照声音频率的变化幅度可以分为: 电话话音质量:200~3400Hz 调幅广播音质:50~7000Hz ,简称AM音质 调频广播音质:20~15000HZ,简称FM音质 激光唱盘音质:10~20000HZ,简称CD音质 ;2.1.2 模拟音频的数字化过程 ; 信息论的奠基者香农(Shannon)指出:在一定条件下,用离散的序列可以完全代表一个连续函??,这是采样定理的基本内容。 为实现A/D转换,需要把模拟音频信号波形进行分割,这种方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。 ; 对声波波形幅度的数字化表示称之为“量化”。量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。 以8位(bit)或16位(bit)的方式来划分纵轴。也就是说在一个以8位为记录模式的音效中,其纵轴将会被划分为?个量化等级,用以记录其幅度大小。;采样和量化; D/A转换器从上图得到的数值中重构原来信号时,得到下图蓝色线段所示的波形。可以看出,蓝色线与原波形(红色线)相比,其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。 ; 失真是不可避免的,如何减少失真呢?在下图中,采样率和量化等级再提高了一倍。从图中可以看出,当用D/A转换器重构原来信号时(图中的轮廓线),信号的失真明显减少,信号质量得到了提高。;3. 编码 模拟信号量经过采样和量化以后,形成一系列的离散信号——脉冲数字信号。这种脉冲数字信号可以一定的方式进行编码,形成计算机内部运行的数据。 所谓编码,就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据。;2.1.3 数字音频的文件格式 在多媒体技术中,存储音频信息的文件格式主要有:WAV文件、VOC文件和MP3文件等。 1. WAV文件 WAV文件又称波形文件,来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值轮换成二进制数,然后存入磁盘,这就产生了波形文件。WAV文件用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。; 请计算对于5分钟双声道、16位采样位数、44.1kHz采样频率声音的不压缩数据量是多少?;解: 根据公式: 数据量=(采样频率×采样位数×声道数×时间)/8 得,数据量=[44.1×1000×16×2×(5×60)] /(8×1024×1024) =50.47MB 因此,声音的不压缩数据量约为50.47MB。 计算时要注意几个单位的换算细节: 时间单位换算:1分=60秒 采样频率单位换算:1kHz=1000Hz 数据量单位换算:1MB=1024×1024=1048576B;未压缩的声音文件的存储量可用下式计算: 存储量(KB) =(采样频率KHZ×采样位数bit×声道数×时间秒)/8 ;2.VOC文件 VOC文件是Creative公司所使用的标准音频文件格式,多用于保存 Creative Sound Blaster(创新声霸)系列声卡所采集的声音数据,被Windows平台和DOS平台所支持。 ;3.MPEG音频文件——.MP1/.MP2/.MP3 MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3),分别对应MP1、MP2和MP3这三种声音文件; MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~12∶1,也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。 ; 4. RealAud

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档