矢量和激励线性预测编码器.ppt

下载文档 降价啦

29
0
约2.14万字
约 124页
2017-08-16 发布于天津
举报
版权申诉
保障服务

矢量和激励线性预测编码器.ppt

1、本文档共124页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

多媒体通信技术第一章多媒体通信技术概述第二章音频技术基础第三章图像技术基础第四章视频信息压缩与处理第五章多媒体通信系统中的关键技术第六章多媒体通信网络技术第七章多媒体数据的分布式处理第八章多媒体通信应用系统第二章音频技术基础音频信息涉及人耳所能听到的声音信息包括语声和乐声据统计人类从外界获得的信息大约有是从耳朵得到的由此可见音频信息在人类获得信息方面的重要性本章主要介绍声学的基础知识音频信息的数字化以及相关的音频信息编码标准声学基础知识音频信息编码分类常用压缩编码方法音频信息压缩编码标准多媒体音

多媒体通信技术第一章多媒体通信技术概述第二章音频技术基础第三章图像技术基础第四章视频信息压缩与处理第五章多媒体通信系统中的关键技术第六章多媒体通信网络技术第七章多媒体数据的分布式处理第八章多媒体通信应用系统第二章音频技术基础音频信息涉及人耳所能听到的声音信息，包括语声和乐声。据统计，人类从外界获得的信息大约有16%是从耳朵得到的，由此可见音频信息在人类获得信息方面的重要性。本章主要介绍声学的基础知识、音频信息的数字化以及相关的音频信息编码标准。 2.1 声学基础知识 2.2 音频信息编码分类 2.3 常用压缩编码方法 2.4 音频信息压缩编码标准 2.5 多媒体音频信号文件格式 2.1 声学基础知识人类获取信息的方法主要有“听”和“看”两种。看是通过眼睛读或是观察文字、图形和图像等，听则要用耳朵来接受语音、音乐及其他声音。因而在多媒体系统中加入声音功能是必不可少的，我们希望一个计算机系统既能发音又能记录各种声音，当然还要能对声音进行编辑制作。当一种物体使空气发生振动时就产生了声音。比如讲话时声带的振动、拉琴时琴弦的振动以及扬声器纸盆的振动等都会产生声音。这样的声音可以用声波来表示。声波是一条随时间变化的连续曲线。一切能发出声音的物体称为声源。声音是由于声源的振动而产生的，由于声源的振动，借助于它们周围的介质，把这种振动以机械波的形式由近及远地传向远方，这就是声波。声波传入人耳，致使耳膜也产生振动，这种振动被传导到听觉神经，人们就产生了“声音”的感觉。我们日常听到的声音是在时间和幅度上都连续的模拟信号。声音按其频率的不同可分为次声、可听声和超声。人们把频率小于20Hz的信号称为亚音信号，或称为次音信号(subsonic)；高于20kHz的信号称为超音频信号，或称超声波(ultrasonic)信号；位于中部的即为可听声。多媒体计算机中的声音主要指20Hz～20kHz的可听声——音频(audio)信号。因此，我们就把多媒体计算机的声音处理技术称为音频信号处理技术。虽然人的发音器官发出的声音频率大约是80~3400Hz，但人说话的信号频率通常为300~3400Hz，人们把在这种频率范围的信号称为话音(speech)信号。音频信号是一种复合信号，由许多频率不同的信号组成。音频信号的一个重要参数就是带宽，用来描述组成复合信号的频率范围。如高保真声音的频率范围为10~20000Hz，它的带宽约为20kHz，而视频信号的带宽是6MHz。几种常见的声音频宽一般说来，覆盖频率越宽则声音质量越好。通常语音信号电话或调幅广播质量的声音已基本可以满足要求，而对于音乐则要求具有调频广播或激光唱片的声音质量。语音常用可懂度、清晰度和自然度来衡量，而音乐则要用保真度、空间感和音响效果等指标来衡量。 2.1 声学基础知识 2.1.1 音频信号特性音频信号的特性可以从时域和频域两方面进行说明。声音信号的时域特性说明了人们听到的声音从产生到结束的过程。这一过程大致可以分为3个阶段：起始、稳定、结束。声音信号的频域特性是指声音信号是由很多的正弦分量组成的，我们所感兴趣的是这些个正弦分量对整个声音信号的影响是怎样的。从频谱分析来看，大多数声音都是由线状谱和连续谱组成的。单一频率信号是线状谱，包含所有频率分量的信号是连续谱。从幅度来看，连续谱相比于线状谱来说比较弱，使整个声音在人耳的听觉来看是表现出有明确音高的有调音的特性。但这些很弱的连续谱还是不能一概忽略的。正是有了这些连续频谱成分，才使声音显得生动、活泼、真实。在多媒体技术中，研究人员常用声波频率、声压、声强等参数来描述声音。声压及声压级SPL（Sound Pressure Level）是常用的声音描述参量。简单来说，声压就是声音的压力。声压级 SPL是为了很好的描述人耳对声音的感觉所使用的物理量。研究人耳对声音强弱的感觉是用声压及声压级来说明的。它是用来说明当声音的强弱出现线性的变化时，人耳对这种声音强弱线性的变化感觉是否也是线性的。实际上，人耳对声音强弱的变化感觉并不是线性的。当声压太小时，人耳是感觉不到的。我们把能引起人耳听到声音时的声压称为听阈，频率1kHz时的听阈为2×10-5Pa ；将引起人耳疼痛的声压称为痛阈，约为20Pa 。人耳对