语音与音频编码论文.docVIP

下载本文档

27
0
约6.46千字
约 10页
2016-04-07 发布于湖北
举报
版权申诉

语音与音频编码论文.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《语音与音频编码》课程论文题目：MP3编码原理与实现院（系）信息科学与工程学院班级 11级通信工程2班学号 1115107007 姓名指导老师目录 MP3编码原理与实现 1 1、摘要 3 2、MP3简介 3 2.1 MP3音频格式 3 2.2 MP3压缩编码原理 4 3、人体听觉心理学模型 5 3.1 最小听觉门槛判定 5 3.2 人耳的遮蔽效应 5 3.3 人耳的空间响应 5 VBR技术 6 5、编码器工作原理 6 5.1 滤波器段 6 5.2 人体听觉心理模型 7 5.3 量化与编码 8 6、总结与心得 9 7、参考文献 10 1、摘要：在目前的信息社会，需要应用和传输大量的语音信息，这些信息中存在着大量的冗余，如果不去除掉这些冗余，在其传输和存储的过程中，将会占用大量的资源，因此，语音压缩技术受到了人们的普遍关注。在此基础上，对MP3编码器的基本原理和基本结构进行了研究，并对其中几个关键模块包括心理声学模型，VBR技术等进行了分析，结果表明MP3要具有良好的编码质量，需要对其算法进行改进和优化。关键词：MP3编码器、音频、算法 2、MP3简介 MP3是今天一种常见的音乐格式，但恐怕除了工作要求之外，有兴趣对此进行研究的人恐怕不多。所以，当我打算写MP3编码方面的论文时，在找资料时也颇费了一番周折，同时也觉得很有趣。 MP3是MPEG-1 Audio Layer 3的简称，是当今比较流行的一种数字音频编码和有损压缩格式（有Layer 3，也必然有Layer1和Layer2，也就是MP1和MP2，但不在本文讨论范围之内）。MP3技术的应该可以用来大幅度的降低音频文件存储所需要的空间。它丢掉脉冲编码调制（PCM）音频数据中对人类听觉不重要得数据，从而达到了较高的压缩比（高达12：1－10：1）。简单地说，MP3在编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成有较高压缩比的MP3文件，并使压缩后的文件在回放时也能够达到比较接近原音源的效果。 MP3的音频质量取决于它的Bitrate和Sampling frequency，以及编码器质量。MP3的典型速度介于每秒128到320kb之间。采样频率也有44.1，48和32 kHz三种频率，比较常见的是采用CD采样频率——44.1kHz。常用的编码器是LAME，它完全遵循LGPL的MP3编码器，有着良好的速度和音质。 2.1 MP3音频格式 MP3(MPEG Audio LayerⅢ)音频格式诞生于20世纪80年代，是伴随着MPEG-1而开发的。在MPEG-1标准中，音频压缩标准按复杂性和压缩质量分为三个独立层次：(1)MPEG Audio LayerⅠ，它最为简单，码流为每通道384kb/s，主要用于数字卡座(Digital Compact Cassette，DCC)。(2)MPEG Audio Layer Ⅱ，它具有中等复杂度，码流为每通道192kb/s，主要用于数字音频广播、数字演播室和VCD等方面数字音频的制作、交流、存储和传送。(3)MPEG Audio Layer Ⅲ，它最为复杂，是综合了MPEG Audio LayerⅡ和ASPEC优点的一种混合压缩技术，其音频质量最好，主要用于MP3音频压缩，码流为每通道64kb/s。MP3编码虽不适用于实时传送，但能在低编码速率下提供较高的音质，所以成为网上音乐的宠儿。2.2 MP3压缩编码原理在MPEG-1的音频压缩中，采样频率可为32kHz、44.1kHz和48kHz，可支持单声道(Monophonic)、双单声道 (DualMonophonic)、立体声模式(Stereo Mode)、联合立体声(JointStereo)等。常见的MP3大多采用联合立体声模式。音频压缩可以分为无损(lossless)压缩和有损压缩。无损压缩就是尽量降低音频数据的冗余度，以减小其体积。音频信号经过编码和解码之后，必须要和原来的信号一致。无损压缩的压缩率是比较有限的；有损压缩就是用尽一切手段，包括无损压缩用到的方法，丢掉一切能丢掉的数据，以减小体积。而音频压缩后解码听起来起码是要跟原来差不多的，有损压缩的压缩比能大幅提高，MP3就是属于有