第三章多媒体音频技术.pptVIP

下载本文档

9
0
约2.88千字
约 81页
2017-05-04 发布于四川
举报
版权申诉

第三章多媒体音频技术.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第三章多媒体音频技术

第3章多媒体音频技术;3.1 音频基础;2．声音的频率;声音质量的标准;多媒体数据压缩的国际标准 ;3．声音的传播方向 ;4．声音的三要素 ;;5．音质 ;音频; 2.2 多媒体音频 ;; 2.2.1 波形音频 ; 1．声音的基本特征 ;声波是随时间连续变化的物理量，它有3个重要指标：振幅——波的高低幅度，表示声音的强弱；周期——两个相邻波之间的时间长度；频率——每秒振动的次数，以Hz为单位。; 基线是测量模拟信号的基准点。声波的振幅表示声音信号的强弱程度。声波的频率反映出声音的音调，声音细尖表示频率高，声音粗低表示频率低。振幅和频率不变的声音信号，称为单音。单音一般只能由专用电子设备产生。在日常生活中，我们听到的自然界的声音一般都属于复音，; 2．数字音频 ;3.1.2 声音的数字化 ;(1). 采样和量化 ; 模拟声音在时间上是连续的，或称连续时间函数x(t)。用计算机处理这些信号时，必须先对连续信号采样，即按一定的时间间隔(T)在模拟声波上截取一个振幅值(通常为反映某一瞬间声波幅度的电压值)，得到离散信号x(nT) (n为整数)。T称采样周期，1/T称为采样频率。为了把采样得到的离散序列信号x(nT)存入计算机，必须将采样值量化成有限个幅度值的集合x(nT)，采样值用二进制数字表示的过程称为量化编码。;(2). 影响数字音频质量的技术参数;2). 量化位数量化位数也称“量化精度”，是描述每个采样点样值的二进制位数。就是通常所说的声卡的位数。例如，8位量化位数表示每个采样值可以用28即256个不同的量化值之一来表示，而16位量化位数表示每个采样值可以用216即65536个不同的量化值之一来表示。常用的量化位数为8位、12位、16位、32位。;; D/A转换器从上图得到的数值中重构原来信号时，得到下图中蓝色(直线段)线段所示的波形。从图中可以看出，蓝色线与原波形(红色线)相比，其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。 ; 失真在采样过程中是不可避免的，如何减少失真呢？可以直观地看出，我们可以把上图中的波形划分成更为细小的区间，即采用更高的采样频率。同时，增???量化精度，以得到更高的量化等级，即可减少失真的程度。在下图（左）中，采样率和量化等级均提高了一倍，分别为2000次/秒和20个量化等级。在下图（右）中，采样率和量化等级再提高了一倍，分别达到4000次/秒和40个量化等级。从图中可以看出，当用D/A转换器重构原来信号时（图中的轮廓线），信号的失真明显减少，信号质量得到了提高。;Sampling Resolution 8 bit Sampling Frequency 11 KHz;Sampling Resolution 16 bit Sampling Frequency 22 KHz;3). 声道数声音通道的个数称为声道数，是指一次采样所记录产生的声音波形个数。记录声音时，如果每次生成一个声波数据，称为单声道；每次生成两个声波数据，称为双声道（立体声）。随着声道数的增加，所占用的存储容量也成倍增加。;双声道立体声;2.1声道环绕立体声;5.1声道环绕立体声;(3). 数字音频文件的存储量 ;质量等级;(4). 数字音频信号的编码 ;3.1.3 声音文件的格式 ;1.4.1 声音文件的基本格式;WAV 文件;MIDI; VOC 文件:VOC 文件也是一种数字声音文件，主要用于DOS 程序。与波形文件相似，可以方便地互相转换。;听觉系统的感知特性;听觉系统的感知特性;听觉系统的感知特性;听觉系统的感知特性;听觉系统的感知特性;感知编码(perceptual audio coding);MPEG声音的压缩依据;MPEG-1 Audio;;MP3;MP4压缩技术 ;MP4的特点;高保真立体声音频压缩标准 ; 数字波形文件数据量大，数字音频的编码必须采用高效的数据压缩编码技术。音频信号能够被压缩编码的依据有两个，一是声音信号存在着数据冗余；二是利用人的听觉特性来降低编码率，人的听觉具有一个强音能抑制一个同时存在的弱音现象，这样就可以抑制与信号同时存在的量化噪声；另外人耳对低频端比较敏感，而对高频端不太敏感，由此引出了“子带编码技术”。音频信号的压缩编码方式可分为波形编码参数编码和混合编码三种。;评价多媒体数据压缩方法的指标 ;1). 波形编码波形编码的算法简单，易于实现，可获得高质量的语音。常见的三种波形编码方法为：脉冲编码调制(PCM)，实际为直接对声音信号作 A／D转换。只要采样频率足够高，量化位数足够多，就能使解码