决定取样频率.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter4 Multimedia Storage Access 多媒體的存取 惠仙、嘉聲 多媒體蔚為潮流 建立多媒體系統是困難的 4.1 聲音:黑膠唱盤、卡帶、CD 聲音是非書資料最簡單的型式 聲音的兩種普遍型態 高品質:音樂 (music) 低品質:聲音 (voice) 高品質:音樂 由娛樂業推動:數位譯碼 (digital encoding) 數位聲音的規格 聲音頻率(frequency range,單位kHz) 決定取樣頻率(sampling rate) 動態範圍(dynamic range,單位dB) 決定每樣本數的位元 (bits per sample) 取樣頻率必須達到所記錄的最高頻率之兩倍 每增加10分貝則提高10倍的聲音強度 CD是電腦最常用以處理音樂的型式 低品質:聲音 較低品質 較低頻率和較低振幅的電話線 為了節省儲存空間及傳輸時間,語音資料通常會被壓縮 Companding:小振幅會比大振幅呈現更精確的聲音 mu-lawj GSM:數位式行動電話系統的壓縮方式 Problems 編目 儲存 搜尋 瀏覽 版權問題 聲音的處理 改變語音的速度 簡單的時間壓縮 分割 4.2 圖像:GIF JPEG GIF JPEG ImagePac Wavelet GIF (Graphic Information Format) 是一種普遍的格式 最多儲存256色的色彩階數 檔案格式較小,適用於網路上圖檔傳輸 儲存方式有兩種 Lempel – Ziv 演算法 將圖檔模式降至黑白、灰階或是256彩色 可以在網頁上做透明背景和動畫模式 JPEG (Join Photographic Experts Group) Apple公司的一項重要發明 具破壞性的壓縮方式 在儲存過程中可以決定壓縮的層級 JPEG格式會造成影像的失真 檔案小、傳送快,適合放在網路上供瀏覽 可接受更多圖片變化,特別是自然景色 ImagePac 用於Kodak’s PhotoCD 也適用於自然景觀 詮釋細節比色差佳 Wavelet 和JPEG之異同 同:將圖片做空間性的傅立葉轉換 異:處理的是整張圖片而非區塊 比JPEG更能描述細節 更高的壓縮性 Dithering (細緻過網方式) 提高圖片品質的方法 將色彩或灰階以該色所需之不同色點(dots)來表示 被dither的圖片 Problems 圖像和聲音一樣被拿來跟實際所見比較 圖像的顏色、明亮度和對比 gamma:訊息強度和亮度關係曲線的係數 圖書館如何儲存圖片和聲音? 如何尋找? QBIC (Query by Image Content) 以位元組合 (bit pattern) 來組織圖片 整合圖片特徵以供檢索和回應 使用下列特徵: 顏色 材質 粗糙度 (coarseness) 對比度 (contrast) 方向性 (directionality) 形狀 柏克萊 哥倫比亞 4.3 Automatic Speech Recognition 起源: 電腦語言學的開始 1970年 ARPA發起在語言了解的各項工作 一開始的四大困境 是否可以正常連續的說話,還是需要在字與字之間分離暫停。 是否可以分辨所有的使用者,還是系統只能為某一個特定的使用者設計。 對話的內容可以是任何話題嗎?還是只能侷限於某一個主題或是一小段話。 口述內容是否只能在300-3300Hz(大約是電話機的音量),或是只能在安靜的房間裡透過麥克風說話。 近幾年的進步 馬可夫模型(hidden Markov Models, HMMS) 卡耐基美隆(Carnegie Mellon Univ) James Baker教授於1970年代首先使用HMMS於語音辨識應用,並有70%-90%的辨識成功率。 近幾年的進步 (續) Alex Waibel則發展可以接受連續發音以及大量字彙的口述辨識系統,並只有10%的錯誤率。 進步一些來自於快速的電腦和處理器,一些則是演算法的進步。 瓶頸 即使只有5%的錯誤率也相當不正確(大約每一句就有一個字的錯誤) 語音驗證 說話者可被要求說特定的話,並藉此了解說話者的身分 到目前為止語音驗證仍舊是慢速且敏感的機器,而且常會被週遭的噪音所干擾。 4.4Moving Images: MPEG and Motion JPEG 電影工業製品的數位化 電影畫面的合成 ex. Jurassic Park( 侏儸紀公園),Toy Story(玩具總動員)。 Disk space for one minute Mode Storage --------------------------

文档评论(0)

136****3783 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档