- 1
- 0
- 约4.16千字
- 约 5页
- 2016-11-23 发布于天津
- 举报
文字壓縮–LZ78.doc
文字壓縮 – LZW演算法
黃育銘
國立暨南國際大學資訊工程系助理教授
E-Mail : ymhuang@csie.ncnu.edu.tw
假設我們想用電腦來儲存以下一段9個字元之文字資料,ABBBABAAB,如果每個字元用7個位元之ASCII碼(不含同位元)來儲存,則需63個位元之記憶體。然而,該電腦如果已擁有一個如表一之電腦字典,很幸運的,藉助該字典的資訊則僅需10個位元的記憶體,亦即AB、BB、AB、A、及AB等文字資料分別會先被編碼成10、11、10、00、及10等十個位元,然後再存入記憶體,其省下的儲存空間高達84﹪。之後,如果一次以兩個位元的方式來讀取資料,同樣地透過該字典的查尋,則記憶體內所儲存的資料1011100010,很快地就會被解讀出原來之文字資料ABBBABAAB。
字典索引 索引之對應編碼值 字典內容 1 00 A 2 01 B 3 10 AB 4 11 BB 表一. 電腦字典1
J. Ziv 及 A. Lempel兩位博士,於西元1977年及1978年〔參考文獻1 及2〕,陸續提出了兩篇有關文字資料壓縮的論文,該論文演算法在之後的文獻裏分別被稱作 LZ77及LZ78,奠定了爾後文字資料壓縮研究的良好根基。其中LZ78演算法的精神,相似於上述字典編碼法的觀念。西元1984年,T.A. Welch博士〔參考文獻3〕針對LZ78演算法作改進
原创力文档

文档评论(0)