音讯压缩的位元分配.pdfVIP

下载本文档

6
0
约9.37千字
约 8页
2018-02-28 发布于河南
举报

音讯压缩的位元分配.pdf

音讯压缩的位元分配

第二章音訊壓縮的位元分配本章我們先介紹音訊壓縮的架構及流程。接下來以 MPEG- 1 層次三為例，介紹分析後合成的方法如何進行位元分配。最後提出我們所使用的快速位元分配架構並分析其優缺點。 2.1 音訊壓縮的架構音訊壓縮(或稱音訊編碼) ，尤其是感官式的音訊壓縮，其流程如圖一所示。聲音訊號,S(n) 時間頻率對應聲音訊號,S(m,f) 聲響心理模型其他編碼器 SMR(q) X(m,f) 位元分配器量化器 Sclae(q),Global Scale X’(m,f) 可變長度編碼存在位元 Y(k) 包裝圖 1 感官式音訊編碼器示意圖 4 時間頻率對應模組以視窗 (Window) 為單位將將聲音訊號從時間域轉換到頻率域，輸入為聲音序列 S(n) ，輸出則為頻率區段 S(m,f) ，m 代表視窗區段的索引, f 是頻率索引。一般來說,音訊編碼會使用各種編碼器來達成較高的壓縮率。舉例來說，矩陣運算，例如集中式編碼 (intensity coding) ，藕合 (coupling) 技巧，以及和差式編碼都可以用來移除頻道間的冗餘及不相關的部分。此外,噪音修飾及頻線預測可以用來移除框架間的冗餘。在 MPEG-2 AAC 及 MPEG-4 T/F Coding 更採用了在時間域進行的噪音修飾方法 [ 11 ] 以達成較佳的噪音分配。這些不同的編碼器在圖一中被歸類為其他編碼器，其輸入為頻率區段 S(m,f) ，輸出則為 X(m,f) 。量化器利用有限的階數來表示 X(m,f) ，量化器必須控制量化噪音使得失真夠小。它的輸入是 X(m,f) ，輸出則為X’(m,f) 。量化器的階數由量化參數來控制，經過編碼量化的參數必須傳送到解碼端，在解碼端才可以利用量化參數的資訊來還原訊號。音訊壓縮一般將頻線分成數個集合，稱為量化頻帶。每個量化頻帶內的頻線數目由關鍵頻帶 (Critical Band) 及傳送量化參數所能容能的位元數目決定。量化頻帶越多，傳遞量化參數所需的位元數就越多。聲響心理模型 (Psychoacoustical Model) 分析輸入的訊號，計算人耳在各個頻帶所容許的聽覺誤差，最後將每個頻帶的訊號遮蔽比 (Signal-to-Masking Ratio) 提供給位元分配器 (Bit Allocator) 。位元分配器依聲響心理模型提供的資訊與存在位元數決定每個量化頻帶的位元使用。可變長度編碼 (VLC ，Variable Length Coding) 利用 X’(m,f) 的統計特性，將不同發生頻率的量化值給予不同長度的符碼。編碼的最後過程則是將上述編碼器產生的參數依特定的標準或協定加以包裝。將時間頻率對應模組與其他的編碼器結合後可以得到如圖 2 經過簡化的感官式音訊編碼器。 5 聲音訊號,S(n) 聲響心理模型對應器

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

音讯压缩的位元分配.pdfVIP