音频压缩由编码和解码两个部分组成-read.docVIP

音频压缩由编码和解码两个部分组成-read.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
音频压缩由编码和解码两个部分组成-read

【轉載】MP3編碼原理概述音頻壓縮由編碼和解碼兩個部分組成。把波形文件裡的數字音頻數據轉換為高度壓縮的形式(稱為比特流)即為編碼;要解碼則把比特流重建為波形文件。   音頻壓縮可以分為無損(lossless)壓縮和有損壓縮。無損壓縮就是盡量降低音頻數據的冗余度,以減小其體積。音頻信號經過編碼和解碼之後,必須要和原來的信號一致。無損壓縮的壓縮率是比較有限的,不過現在比較出色的APE能做到50%的壓縮率(本人用Monkeys Audio 3.97,Extra High壓縮模式下壓縮WAV,壓縮率最低能達到52%);有損壓縮就是用盡一切手段,包括無損壓縮用到的方法,丟掉一切能丟掉的數據,以減小體積。而音頻壓縮後解碼聽起來起碼是要跟原來差不多的,有損壓縮的壓縮比能大幅提高,MP3就是屬於有損壓縮,壓縮比是12:1(128kbps)。   MP3文件是由幀(frame)構成的,幀是MP3文件最小的組成單位。什麼是幀?還記得最初的動畫是怎麼做的嗎?不同的連續畫面切換以達到動態效果,每幅畫面就是一個“幀”,不同的是MP3里面的幀記錄的是音頻數據而不是圖形數據。MP3的幀速度大概是30幀/秒。   每個幀又由幀頭和幀數據組成,幀頭記錄著該幀的基本信息,包括位率索引和采樣率索引(這對理解ABR和VBR編碼方式很重要)。幀數據,顧名思義就是記錄著主體音頻數據。   上面說的都是MP3編碼的基礎,但事實上,早期的編碼器都非常不完善,壓縮算法近於粗暴,音質很不理想。MP3的音質達到現在的水平有兩次飛躍:人體聽覺心理學模型(Perceptual Model)的導入和VBR技術的應用。   ◆人體聽覺心理學模型   下面將簡要介紹一下幾個重要原理:   1) 最小聽覺門檻判定 (The minimal audition threshold)   人耳的聽力範圍是20Hz-20k Hz的頻率範圍,但是人耳對不同的頻率聲音的靈敏度是不同的,不同頻率的聲音要達到能被人耳聽到的水平所需要的強度是不一樣。那麼通過計算,可以把音樂文件中存在但不能被人耳聽到的聲音去掉。 通過這原理,我們還可以建立模型,把大部分數據空間分配到人耳最靈敏的2kHz到5kHz範圍,其餘頻率分配比較少的空間;   2) 人耳的遮蔽效應 (The Masking effect)   蔽效應表現在強信號會遮蔽鄰近頻率的弱信號。用生活經驗來說,在安靜的房間中,一根針掉到地上都能聽見,可到了大街上,就算手機音量調到最大,來電時也未必能聽見,而手機的聲音確確實實是存在的,原因就是被周圍更大的聲音遮蔽了。有了對遮蔽效應的研究成果,編碼器就能根據已建立的數學模型,計算強信號對附近弱信號的遮蔽,把能引起人們注意的聲音才保留。   人耳還有前遮蔽效應和後遮蔽效應:因為人需要一定的時間來處理聲音信號,在強信號之前或之後的弱信號,會被遮蔽掉。前遮蔽效應的時間約只有2-5ms,而後遮蔽的時間比較長,大約有100ms。利用這,我們能減小強信號之前和之後的分辨率;   3) 人耳的空間響應: 人耳對某些高頻的聲音的空間感很差,辨別不了聲源的方向。聯合立體聲(Joint Stereo)應運而生:在某些頻率上採用“單聲道”(事實上並非真正意義上的單聲道),以減小流量。   ◆VBR技術   正如上面所說,MP3是由幀構成的,MP3能象動畫那樣讀到哪放到哪, 播放器不必預讀整個文件的內容,即使部分數據損壞也不會對播放效果有太大影響(實際上這就是流媒體所具有的特性)。而每個幀的幀頭裡都包含這該幀的碼率(bitrate,單位是kbps)等信息,所以,我們可以對每一段音樂甚至每一個幀定義獨立的碼率,這就是VBR(Variable bitrate,動態碼率)技術。   與VBR向對應的是CBR(Constant bitrate)。一支交響曲,合奏大動態部分的數據量顯然大於引子部分,如果用128kbps的CBR編碼方式來編碼,在引子部分可能有多餘的數據流量,而在合奏部分卻又不夠,VBR就是解決這個問題的。把在不影響音質的情況下,對流量需求小的部分分配較小的碼率,把冗余字節緩存起來留給有需要的部分,在短時間內提供更高的碼率,以保證音樂的質量。 所以說,VBR的作用是更合理的分配流量,在不增大文件體積的條件下提高聲音的質量。   不過VBR在應用初期帶給過MP3隨生聽不少麻煩。因為早期大多數MP3播放器都是針對CBR設計的,其根據文件大小來獲得時長的算法對VBR失效了,因為VBR MP3的bitrate可能每時每刻都在變化。不過現在這個問題基本上不用擔心了,市場上的播放器基本上都解決這問題了。   除了上面說的兩方面,MP3編碼還有很重要的一招:Huffman編碼(Huffman是個科學家的名字),Huffman編碼廣泛應用於無損壓縮領域

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档