- 6
- 0
- 约9.37千字
- 约 8页
- 2018-02-28 发布于河南
- 举报
音讯压缩的位元分配
第二章 音訊壓縮的位元分配
本章我們先介紹音訊壓縮的架構及流程。接下來以 MPEG- 1 層次三為例,介紹分析
後合成的方法如何進行位元分配。最後提出我們所使用的快速位元分配架構並分析其優
缺點。
2.1 音訊壓縮的架構
音訊壓縮(或稱音訊編碼) ,尤其是感官式的音訊壓縮,其流程如圖一所示。
聲音訊號,S(n)
時間頻率對應
聲音訊號,S(m,f)
聲響心理模型
其他編碼器
SMR(q)
X(m,f)
位元分配器 量化器
Sclae(q),Global Scale X’(m,f)
可變長度編碼
存在位元
Y(k)
包裝
圖 1 感官式音訊編碼器示意圖
4
時間頻率對應模組以視窗 (Window) 為單位將將聲音訊號從時間域轉換到頻率
域,輸入為聲音序列 S(n) ,輸出則為頻率區段 S(m,f) ,m 代表視窗區段的索引, f 是頻
率索引。
一般來說,音訊編碼會使用各種編碼器來達成較高的壓縮率。舉例來說,矩陣運算,
例如集中式編碼 (intensity coding) ,藕合 (coupling) 技巧,以及和差式編碼都可以用來
移除頻道間的冗餘及不相關的部分。此外,噪音修飾及頻線預測可以用來移除框架間的冗
餘。在 MPEG-2 AAC 及 MPEG-4 T/F Coding 更採用了在時間域進行的噪音修飾方法
[ 11 ] 以達成較佳的噪音分配。這些不同的編碼器在圖一中被歸類為其他編碼器,其輸
入為頻率區段 S(m,f) ,輸出則為 X(m,f) 。
量化器利用有限的階數來表示 X(m,f) ,量化器必須控制量化噪音使得失真夠小。它
的輸入是 X(m,f) ,輸出則為X’(m,f) 。量化器的階數由量化參數來控制,經過編碼量化
的參數必須傳送到解碼端,在解碼端才可以利用量化參數的資訊來還原訊號。
音訊壓縮一般將頻線分成數個集合,稱為量化頻帶。每個量化頻帶內的頻線數目由
關鍵頻帶 (Critical Band) 及傳送量化參數所能容能的位元數目決定。量化頻帶越多,傳
遞量化參數所需的位元數就越多。
聲響心理模型 (Psychoacoustical Model) 分析輸入的訊號,計算人耳在各個頻帶所
容許的聽覺誤差,最後將每個頻帶的訊號遮蔽比 (Signal-to-Masking Ratio) 提供給位元
分配器 (Bit Allocator) 。位元分配器依聲響心理模型提供的資訊與存在位元數決定每個
量化頻帶的位元使用。
可變長度編碼 (VLC ,Variable Length Coding) 利用 X’(m,f) 的統計特性,將不同發
生頻率的量化值給予不同長度的符碼。編碼的最後過程則是將上述編碼器產生的參數依
特定的標準或協定加以包裝 。
將時間頻率對應模組與其他的編碼器結合後可以得到如圖 2 經過簡化的感官式音
訊編碼器。
5
聲音訊號,S(n)
聲響心理模型
對應器
您可能关注的文档
最近下载
- 沈阳铁路局员工合同协议.docx VIP
- 2025年心理咨询师考试题库500道附参考答案【实用】.docx VIP
- 鱼骨图分析法(鱼骨图模板).doc VIP
- 2025年部编版三年级上册语文期末冲刺模拟卷三.docx VIP
- KISSsoft软件教程-Tutorial-016-包络面蜗轮蜗杆的验证.pdf VIP
- 《成人甲状腺功能减退症基层诊疗指南(2025版)》.docx VIP
- 三年级数学特训卷.docx VIP
- 搏击操教案15-16(1)完整版.doc VIP
- 2026年内分泌科糖尿病精细化管理实施方案.docx
- (2026春新版)人教版三年级数学下册《一 生活中的运动现象》PPT课件.pptx
原创力文档

文档评论(0)