MP3基础知识培训教程分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MP3文件格式——ID3V2标签格式 标签头 10节字 char Header[3]; /*必须为“ID3”,否则认为标签不存在*/ char Ver; /*版本号ID3V2.3 就记录3*/ char Revision; /*副版本号此版本记录为0*/ char Flag; /*存放标志的字节*/ char Size[4]; /*标签大小所有的标签帧*/ 标签帧头 10节字 char FrameID[4]; /*用四个字符标识一个结点,每个结点可以照表得到*/ char Size[4]; /*帧内容的大小,不包括帧头,不得小于1*/ char Flags[2]; /*存放标志,只定义了6 位,稍后详细解说*/ 标签帧内容 char Encode; /*编码方式,包括四种*/ char Endian[2]; /*大小端*/ 思路:1、标签头中找到标签的总大小; 2、标签帧头中得到标签的大小; 3、标签帧内容的前三个字节得到标签的编码方式; 4、得到标签内容; 5、根据标签的总大小判断还否还有标签帧; MP3文件格式——ID3V2标签解析思路 项 值 含义 Encode 0 ISO-8859-1,单字节编码,相当于ANSII。 Encode 1 UTF-16,双字节编码,带字节序,后面紧接的两个字节表示字节序。 Encode 2 UTF-16BE,双字节编码不带字节序,统一按litter endian处理。 Encode 3 UTF-8,多字节可变字节数编码,可为1-6个字节。 Endian FFFE litter-endian Endian FEFF big-endian MP3文件格式——Frame结构 Frame Header:AAAAAAAA AAABBCCD EEEEFFGH IIJJKLMM FRAMEHEADER CRC(free) MAIN_DATA 4 BYTE 0 OR 2 BYTE 长度由帧头计算得出 A Frame sync (all bits set) H Private bit B MPEG Audio version I Channel Mode C Layer description J Joint stereo info D Protection bit K Copyright E Bitrate index L Original F Sampling rate frequency index M Emphasis G Padding bit MP3文件格式——数字音频基本概念 PCM:Pulse-code modulation,脉冲编码调制,它是一种数字音频的表示方法,类似于视频上的YUV或RGB,音频表示方法不止有PCM。 采样:将连续的模拟信号转换为离散的数字信号时的每一次取值。 采样位数:表示每次采样用多少位来表示,有8、16、24、32等。采样位数越多,声音的细节越接近真实。这和24位的RGB能表示的精度比16位RGB高是一样的道理。但采样位数多同时会带来数据量增大,存储时开销大,因此需要在二者间找到一个平衡点。 采样频率:1秒钟内的采样个数,采样频率越高越接近真实。但采样频率高也会带来数据量的剧增。二者也需要找到一个平衡点。常见的采样率有44100、22050等。 位率:1秒钟内的位数。这里的位率是指编码后的位率,不是指采样时和解码后的位率,采样和播放时的位率是固定的。编码后的位率比编码前的位率要小得多。 声道:常见的是单声道和双声道,也有更多声道的。 对于一首歌曲而言,采样位数,采样率都是固定的(人工拼接的歌曲除外)。而位率不一定固定的,它跟编码方式有关,对于固定码率编码它是固定的,对于可变码率编码它是可变的,每帧都有可能不一样。 MP3文件格式——位率 VBR:variable bit rate,可变位率。VBR是常态,因为声音的冗余不一样,其在进行变换后的数据量就不一样,同时编码时如霍夫曼编码都是变长编码。如果保持首歌曲中各帧的质量一样,那么每帧数据编码后的大小通常都不一样。注意如果包含多声道,位率是所有声道的和,因为多个声道是打包在一帧中统一进行编码的。 CBR:constant bitrate,固定位率。绝对的CBR是难于达到的,通常通过调整量化步长来实现CBR。由于每帧的时间是固定的,通常是0.026秒,也就是说每帧的大小要一样,大小一样质量就就不一样。在编码时,CBR通常是要通过反馈来实现。 Xing:它是一个公司名,该公司在MP3的头帧中增加了Xing结构,用来存放VBR的一些额外的信息,是相对于CBR多出的东西,它里存放较为重要的信息包括:文件中总的数据帧数、文件中有效MP3数据的字节数等

文档评论(0)

美洲行 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档