数字音频技术综述.docVIP

下载本文档

2
0
约2.83千字
约 5页
2016-02-01 发布于安徽
举报
版权申诉

数字音频技术综述.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数字音频技术综述.doc

数字音频编码技术综述摘要：本文介绍了常用的数字音频编码方式，包括MPEG系列伴音标准及Dolby Digital 标准的原理，并对这几种重要的音频编码技术的多方面性能进行了比较，最后，对数字音频压缩编码技术进行了展望。关键词：数字音频编码；MPEG；Dolby Digital Overview of Digital Audio Coding Technology 【Abstract】 In this paper, some usual digital audio coding methods are discussed, including MPEG standard and Dolby Digital standard. And comparisons in many aspects are made between these audio coding methods. Finally, it discussed the prospect of digital audio compression. 【Key Words】digital audio coding；MPEG；Dolby Digital 1 引言数字音频是多媒体业务的重要组成部分，数字音频编码技术已经成为多媒体的一个重要研究领域，并已被广泛地应用于数字音频广播（DAB）、高清晰度电视（HDTV）、多媒体网络通信等领域中。数字音频编码技术按数据量的压缩性能可分为非压缩音频（如波形音频、MIMI音频和CD音频）和压缩音频（如MEPG音频、杜比AC-3等）两类。而在网络应用中，为了提高带宽的利用率，增强数据的安全性和传输的可靠性，往往需要对数字音频进行压缩处理。一般地，根据压缩后的音频能否完全重构出原始声音可将音频压缩技术分为无损压缩及有损压缩两大类。而按压缩方案的不同，又可讲其划分为时域压缩、变换压缩、自带压缩，以及多种技术相互融合的混合压缩等等。数字音频的发展最初是从无损压缩开始的，如70年代开始采用的类似PCM的瞬时压扩技术和块压扩技术，这种技术的编码效率低。80年代末至90年代初，研究者利用人耳的掩蔽效应和临界频带的特性来进行子带编码和变换编码，出现的系统有：MUSUCAM系统、128kps的AC-2系统、AC-3系统等。90年代至今，有损压缩把音频数据的压缩率提高到12：1，也带来了音频质量的下降。比较著名的是：MP3，AAC，RM等。 2 MPEG数字音频编码标准 ISO/IEC的MPEG音频编码的标准采用了2种编码算法：MUSICAM和ASPEC。以这两种算法为基础形成了三个不同层次的音频压缩算法，三种算法对应不同的应用要求并具有不同的编码复杂度。子代掩蔽编码标准MUSICAM的编码器框图如图1所示。MUSICAM采用了多项滤波器，将信号分割成带宽统一的32个子带。它增强了心理声学模型分析，1024点FFT是心理声学模型时域分析工具。由于MUSICAM的音质好、合理的算法复杂度和适中的时延等有点，使得它被ISO/IEC选用为MPEG音频编码的主要算法。图1 MUSICAM编码器原理图 2.1 MPEG-1 在MPEG-1的音频编码标准中，按照复杂度规定了三种模式（层I，层II，层III）。层I是MUSICAM编码方法的简单型（MP1），VCD的音频压缩方案即为层1。层II为MUSICAM标准型（MP2），典型码流128kps。广泛应用与数字音频广播、数字演播室等数字音频专业的制作、交流、存储和传送。层III是综合了层II和ASPEC的有点提出的混合压缩技术（MP3），它的复杂度相对较高，编码不利于实时，它是MUSUCAM和ASPEC两个算法的结合，典型码流是64kbps。低码率仍有高品质的音质，因此成为广泛应用于网络音频。MP3编码器的框图如图2所示。图2 MP3编码器的框图 2.2 MPEG-2 MPEG-2的音频编码标准，是在MPEG-1音频编码标准的基础上由双声通道扩展到多通道。声道数扩展到5.1，即左中右三个主声道，左环、右环两个环绕声道和一个重低音（LEF）声道。为了与MPEG-1后向兼容（BC），MPEG-2帧基本结构对应于在MPEG-1中的规定，多声道扩展是插入到MPEG-1音频帧，用于传送附加数据的区域中，信号兼容利用多声道信号的矩阵组合来实现，如果需要更高比特率，则产生一个附加的第二个扩展比特流，为了降低整体比特流，MPEG-2 采用了自适应预测、限制中心声道频率等措施。 MPEG-2有一种AAC（Advanced Audio Coding）模式，它不后向兼容MPEG-1。在MPEG-2的正式听音测试中，数据流速率为320kbps的AAC可以提供比数据流速率为640kbps的MPEG