声音的数位化.pptVIP

下载本文档

6
0
约5.01千字
约 38页
2017-06-13 发布于天津
举报
版权申诉

声音的数位化.ppt

1、本文档共38页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

声音的数位化

最小聽覺門檻 BEFORE AFTER 遮蔽效應由聽覺心理學的模型而來：太陽位元儲存槽可以產生類似VBR的效果：波形簡單時用較低的bit rate 將省下的空間留給波形複雜時用維持整個流量的大小 Joint Stereo 立體音 Intensity Stereo：減少高頻的音場資訊 Mid/Side (M/S) Stereo：以左右聲道都有收到的訊號為主，對左右不同的訊號加以處理一般MP3兩者交互使用 Huffman Coding 一種常見的無失真壓縮的方法利用使用機率來編碼實際使用約可節省20%之空間無失真壓縮 APE的壓縮技巧基本上有三大技巧： Mid/Side Coding Predictor Rice Coding Mid/Side Coding 像先前提到的Mid/Side Stereo，將訊號分為兩喇叭的mean和difference進行編碼 Predictor 在時域上的音樂訊號彼此的關聯性都不小我們可以利用adapting的predictor將訊號中可預測的部份取出 Rice Coding 猜測編碼所需要的位元數 1. 根據先前的經驗猜測coding所需的位元數k 2. 當一個sample進入系統，取出並儲存它的最右k個bits 3. 將overflow的部份取出 4. 對overflow進行編碼，方式是：這個值是多少就加幾個0 e.g. 若k = 4，訊號大小= 18(10010)，則編碼後的結果是00010 Audio * 聲音的數位化什麼是聲音？聲音是像光一樣的波長的現象，但是這是巨觀來看，它其實是牽涉到空氣中的分子在一些實體設備運作下被壓縮與放大的結果。例如，一個音效系統中的喇叭前後的震動產生一個縱向的壓力波，而這個波就是我們所接受到的聲音。. 因為聲音是一個壓力波，它是一個連續的數值，而不是數位資料。即使這樣的壓力波是縱向的，它們仍然有波的特質與行為，如反射(反彈，bouncing), 折射(強度的不同的波進入媒介後角度的改變與繞射(沿著物體周圍彎曲)。假使我們希望使用聲音的數位版本，必須形成聲音資訊的數位表示方式。 * 數位化(Digitization) 數位化意味著轉換成一串數字。下圖是聲音的一維表示圖：振幅值取決於一個一維的變數，就是時間。 * 數位化(Digitization) 上圖必須把時間及振幅作為數位化的參數，也就是取樣時要將它們記錄：一個時間對應一個振幅。取樣即是測量我們想要知道訊號上的數值，取樣的間距通常會是許多相同大小的區間。第一種取樣方式，就是利用在相同長度的時間間隔做測量。這樣測量的速率叫做測量頻率(sampling frequency) 對聲音而言，典型的取樣頻率是8 kHz (8,000 samples per second) 到48 kHz。在振幅或電壓的象限來取樣叫做quantization * * 數位化(Digitization) 數位化因此決定要如何將聲音資料數位化，我們需要知道下列的問題：取樣速率是多少？資料可以量化到什麼程度，量化的量是一致的嗎？聲音資料的格式為何? * Nyquist Theorem 訊號可以被拆成一組正弦波的總和，左圖顯示有比重的正弦撥可以建立一個複雜的訊號。 * Nyquist Theorem Nyquist理論是要告知取樣的頻率要多快才可以還原本來的聲音。下圖(a)顯示單一的一個正弦波：它是一個單純的頻率。假使取樣速率恰好與實際頻率相等，下圖(b)顯示會還原一個錯誤的訊號：它只是一個沒有頻率的常數。再來，如果取樣變成了1.5倍，下圖(c)顯示所得到仍是一個不正確頻率的波 (alias) ，這個波的頻率小於原來訊號：是原來的一半 (頂點間的波長是原來的兩倍)。因此正確的取樣頻率必須至少是原來訊號的兩倍，這就是所謂的Nyquist rate。 * Nyquist Theorem * Signal to Noise Ratio (SNR) 正確訊號與雜訊的的能量比就叫做signal to noise ratio (SNR) 測量訊號品值的方法。 SNR通常是以decibel為單位(dB)，而1 dB就是1bel的十分之一。以db為單位SNR值被定義成電壓平方的以10x為底的對數，詳細定義如下：： SNR = 10log10V2signal /V2noise=20log10Vsignal /Vnoise * Signal to Noise Ratio (SNR) 訊號的能量是與電壓的平方成比正比. 例如: 假始訊號電壓為雜訊訊號電壓的十倍, 那SNR就是20log10(10)=20dB. 就能量而言，10把小提琴的能量當然是一把小提琴能量的十倍，然而以能量比的SN