第三章多媒体音频技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章多媒体音频技术

第3章 多媒体音频技术;3.1 音频基础;2.声音的频率;声音质量的标准;多媒体数据压缩的国际标准 ;3.声音的传播方向 ;4.声音的三要素 ;;5.音质 ;音频; 2.2 多媒体音频 ;; 2.2.1 波形音频 ; 1.声音的基本特征 ;声波是随时间连续变化的物理量,它有3个重要指标: 振幅——波的高低幅度,表示声音的强弱; 周期——两个相邻波之间的时间长度; 频率——每秒振动的次数,以Hz为单位。; 基线是测量模拟信号的基准点。声波的振 幅表示声音信号的强弱程度。声波的频率反映出 声音的音调,声音细尖表示频率高,声音粗低表 示频率低。 振幅和频率不变的声音信号,称为单音。 单音一般只能由专用电子设备产生。在日常生活 中,我们听到的自然界的声音一般都属于复音,; 2.数字音频 ;3.1.2 声音的数字化 ;(1). 采样和量化 ; 模拟声音在时间上是连续的,或称连续时 间函数x(t)。用计算机处理这些信号时,必须 先对连续信号采样,即按一定的时间间隔(T)在 模拟声波上截取一个振幅值(通常为反映某一瞬 间声波幅度的电压值),得到离散信号x(nT) (n为整数)。T称采样周期,1/T称为采样频率。 为了把采样得到的离散序列信号x(nT)存 入计算机,必须将采样值量化成有限个幅度值 的集合x(nT),采样值用二进制数字表示的过程 称为量化编码。;(2). 影响数字音频质量的技术参数;2). 量化位数 量化位数也称“量化精度”,是描述每个采样点样值的二进制位数。就是通常所说的声卡的位数。 例如,8位量化位数表示每个采样值可以用28即256个不同的量化值之一来表示,而16位量化位数表示每个采样值可以用216即65536个不同的量化值之一来表示。常用的量化位数为8位、12位、16位、32位。;; D/A转换器从上图得到的数值中重构原来信号时,得到下图中蓝色(直线段)线段所示的波形。从图中可以看出,蓝色线与原波形(红色线)相比,其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。 ; 失真在采样过程中是不可避免的,如何减少失真呢? 可以直观地看出,我们可以把上图中的波形划分成更为细小的区间,即采用更高的采样频率。同时,增???量化精度,以得到更高的量化等级,即可减少失真的程度。在下图(左)中,采样率和量化等级均提高了一倍,分别为2000次/秒和20个量化等级。在下图(右)中,采样率和量化等级再提高了一倍,分别达到4000次/秒和40个量化等级。从图中可以看出,当用D/A转换器重构原来信号时(图中的轮廓线),信号的失真明显减少,信号质量得到了提高。;Sampling Resolution 8 bit Sampling Frequency 11 KHz;Sampling Resolution 16 bit Sampling Frequency 22 KHz;3). 声道数 声音通道的个数称为声道数,是指一次采 样所记录产生的声音波形个数。记录声音时,如 果每次生成一个声波数据,称为单声道;每次生 成两个声波数据,称为双声道(立体声)。随着 声道数的增加,所占用的存储容量也成倍增加。;双声道立体声;2.1声道环绕立体声;5.1声道环绕立体声;(3). 数字音频文件的存储量 ;质量等级;(4). 数字音频信号的编码 ;3.1.3 声音文件的格式 ;1.4.1 声音文件的基本格式;WAV 文件;MIDI; VOC 文件:VOC 文件也是一种数字 声音文件,主要用于DOS 程序。与波形 文件相似,可以方便地互相转换。;听觉系统的感知特性;听觉系统的感知特性;听觉系统的感知特性;听觉系统的感知特性;听觉系统的感知特性;感知编码 (perceptual audio coding);MPEG声音的压缩依据;MPEG-1 Audio;;MP3;MP4压缩技术 ;MP4的特点;高保真立体声音频压缩标准 ; 数字波形文件数据量大,数字音频的编码 必须采用高效的数据压缩编码技术。音频信号 能够被压缩编码的依据有两个,一是声音信号 存在着数据冗余;二是利用人的听觉特性来降 低编码率,人的听觉具有一个强音能抑制一个 同时存在的弱音现象,这样就可以抑制与信号 同时存在的量化噪声;另外人耳对低频端比较 敏感,而对高频端不太敏感,由此引出了“子带 编码技术”。 音频信号的压缩编码方式可分为波形编码 参数编码和混合编码三种。;评价多媒体数据压缩方法的指标 ;1). 波形编码 波形编码的算法简单,易于实现,可获得 高质量的语音。常见的三种波形编码方法为: 脉冲编码调制(PCM),实际为直接对声音信号作 A/D转换。只要采样频率足够高,量化位数足 够多,就能使解码

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档