Internet音频技术概述.docVIP

下载本文档

2
0
约3.79千字
约 6页
2017-07-26 发布于广东
举报
版权申诉

Internet音频技术概述.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Internet音频技术概述.doc

　　Internet音频技术概述|第1 Inter音频产业随着Inter的普及，Inter也迅速成为一个音乐发行渠道。消费者可以从Inter上把他们最喜欢的歌曲或新近发行的歌曲下载到便携式播放器中。固态音频压缩技术不断推进的里程和具有庞大容量的各种便携式存储媒体的出现，使Inter音频产业呈现欣欣向荣的景象。一些音像公司，500)this.style.ouseg(this)如BMG、EMI和华纳，均向Inter内容提供商提供音乐，而Inter内容提供商则将音乐内容提供给消费者下载。这便产生了一个重要的问题，即如何保护Inter发行渠道中的版权。于是，一些在Inter上提供数字权利管理（DRM）的软件公司，如Liquid Audio、Intertrust、Microsoft和Verence便跻身进入这一领域。这种业务的成功在很大程度上取决于SDMI（安全数字音乐倡议组织），该机构联手录音公司、消费电子公司、器件（半导体芯片）供应商及DRM公司，建立安全方针，确保Inter音乐发行得到保护并具有合法性。以上是这一快速发展领域的总体状况。 MPEG 音频 MPEG是高保真音频压缩的一个国际标准（采用于1992年）。这个标准分为3个层面：II层、III层和I层。流行的MP3是MPEG-1的III层。AAC(高级音频编码)是MPEG的第二阶段(MPEG-2)，MPEG-2是MPEG-1的改进。这个新标准采用于1997年。在同样的压缩比率下，AAC比MP3提供更佳的音频质量。MPEG-2和MPEG-3的采样频率高达44.1kHz 或48kHz，比特率在32kbps至128kbps之间。这些音频压缩标准全都利用了人类听觉系统的直觉特征心理声学。心理声学通过将心理声学模型应用到音频比特流中，可以消除大量无关的音频数据。这一模型使用了频域和时域中强信号的屏蔽效果。频率域屏蔽当一个强信号（屏蔽信号）出现时，500)this.style.ouseg(this)与它同时产生的一个较弱信号（被屏蔽信号）就可能被我们的听觉系统所忽略，前提是在频率域中的被屏蔽信号与屏蔽信号十分相近。这称为频率屏蔽效果（如图1所示）。480Hz将被较强的500Hz信号所屏蔽。通过采集这些频率域在屏蔽效果下的有声和无声的音频水平，可以获得屏蔽阈值。任何振幅比阈值低的信号人耳都听不见，因此可以去除。这将大幅度减少用于对音频信号进行编码的数据量。当这个屏蔽信号变弱时，阈值曲线也随着降低，直到一个水平，到了这个水平后，无论屏蔽信号是否继续减弱，阈值曲线都将保持不变。只要信号大于3 dB，人耳就能听到音频内容。时间域屏蔽（当时屏蔽）这种屏蔽效果不仅在频域发生，而且也在时域发生。当出现一个强信号，并在极短的间隔内跟随一个弱信号时，这个弱信号就几乎被人耳忽略了。这是人类听觉反应系统的感知效果。这种信号屏蔽能力取决于其频率位置和响度。音频编码器将使用这一信息（信号屏蔽比率SMR），利用允许的编码比特数对输入声频信号进行编码。算法基于以上的屏蔽技术，典型的音频编码过程如下所示： 1.使用滤波器带将音频信号分流入频率子带中，大约有32个关键（critical）子带--gt;子带滤波。 2.使用心理声学模型确定每个子带的屏蔽阈值。 3.计算每个子带的信号屏蔽比率（SMR），信号与屏蔽阈值的比率。 500)this.style.ouseg(this) 4.如果一个子带中的功率低于屏蔽阈值，就可以去除这个子带。 5.如果比屏蔽阈值高，应确定用来对采样进行量化的比特数量，使量化噪音低于屏蔽阈值动态比特分配。 6.集合全部量化采样，把它们放入比特流帧中。最终的音频质量主要取决于如何在各个子带中分配比特。解码的复杂程度降低了。在解码过程中无需进行心理声学计算。被编码的比特流被解压缩，经历相反的过程。音频编码和解码过程如图2所示。以上讨论了MPEG I层的一个最基本的音频压缩算法。II层和III层较之I层有了极大改善。 MPEG-1 III 层 (MP3)增强特性 III层的一些主要增强特性包括： * 利用一个MDCT（改进的DCT）处理滤波器输出，从而弥补滤波器的一些不足。 MDCT 进而将子带输出分流，产生更佳的光谱分辨率。 500)this.style.ouseg(this) * MDCT中频率分辨率的改善会产生失真，这证明它们是预回波。III层使用窗口切换技术减少这种预回波－在不同长度的数据库之间切换。 * 每个子带可以有不同的比例因子。 * 使用赫夫曼编码方法对量子化采样进行编码，以获得更佳的压缩率。 * 比特库：与其它层面不同的是，被编码数据无需适应固定长度帧（每次采样有1152个样点）。当编码