音讯压缩的位元分配.pdfVIP

  • 6
  • 0
  • 约9.37千字
  • 约 8页
  • 2018-02-28 发布于河南
  • 举报
音讯压缩的位元分配

第二章 音訊壓縮的位元分配 本章我們先介紹音訊壓縮的架構及流程。接下來以 MPEG- 1 層次三為例,介紹分析 後合成的方法如何進行位元分配。最後提出我們所使用的快速位元分配架構並分析其優 缺點。 2.1 音訊壓縮的架構 音訊壓縮(或稱音訊編碼) ,尤其是感官式的音訊壓縮,其流程如圖一所示。 聲音訊號,S(n) 時間頻率對應 聲音訊號,S(m,f) 聲響心理模型 其他編碼器 SMR(q) X(m,f) 位元分配器 量化器 Sclae(q),Global Scale X’(m,f) 可變長度編碼 存在位元 Y(k) 包裝 圖 1 感官式音訊編碼器示意圖 4 時間頻率對應模組以視窗 (Window) 為單位將將聲音訊號從時間域轉換到頻率 域,輸入為聲音序列 S(n) ,輸出則為頻率區段 S(m,f) ,m 代表視窗區段的索引, f 是頻 率索引。 一般來說,音訊編碼會使用各種編碼器來達成較高的壓縮率。舉例來說,矩陣運算, 例如集中式編碼 (intensity coding) ,藕合 (coupling) 技巧,以及和差式編碼都可以用來 移除頻道間的冗餘及不相關的部分。此外,噪音修飾及頻線預測可以用來移除框架間的冗 餘。在 MPEG-2 AAC 及 MPEG-4 T/F Coding 更採用了在時間域進行的噪音修飾方法 [ 11 ] 以達成較佳的噪音分配。這些不同的編碼器在圖一中被歸類為其他編碼器,其輸 入為頻率區段 S(m,f) ,輸出則為 X(m,f) 。 量化器利用有限的階數來表示 X(m,f) ,量化器必須控制量化噪音使得失真夠小。它 的輸入是 X(m,f) ,輸出則為X’(m,f) 。量化器的階數由量化參數來控制,經過編碼量化 的參數必須傳送到解碼端,在解碼端才可以利用量化參數的資訊來還原訊號。 音訊壓縮一般將頻線分成數個集合,稱為量化頻帶。每個量化頻帶內的頻線數目由 關鍵頻帶 (Critical Band) 及傳送量化參數所能容能的位元數目決定。量化頻帶越多,傳 遞量化參數所需的位元數就越多。 聲響心理模型 (Psychoacoustical Model) 分析輸入的訊號,計算人耳在各個頻帶所 容許的聽覺誤差,最後將每個頻帶的訊號遮蔽比 (Signal-to-Masking Ratio) 提供給位元 分配器 (Bit Allocator) 。位元分配器依聲響心理模型提供的資訊與存在位元數決定每個 量化頻帶的位元使用。 可變長度編碼 (VLC ,Variable Length Coding) 利用 X’(m,f) 的統計特性,將不同發 生頻率的量化值給予不同長度的符碼。編碼的最後過程則是將上述編碼器產生的參數依 特定的標準或協定加以包裝 。 將時間頻率對應模組與其他的編碼器結合後可以得到如圖 2 經過簡化的感官式音 訊編碼器。 5 聲音訊號,S(n) 聲響心理模型 對應器

文档评论(0)

1亿VIP精品文档

相关文档