- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
技术写作.ppt
魔鏡 科技文選II教材 任職單位:資訊工程系 報 告 者 :王 木 良 報告日期:2007/03/04 大綱 系統簡介 半反射鏡面與液晶顯示器 自動語音辨識 語音及唇形合成 影像處理 未來技術發展 系統簡介 在「優質數位生活體驗屋」,成大電機系及資工系共同研發展示之多媒體人機互動系統 提供服務 提供虛擬精靈對話功能 語音聲控操作及回應 查詢時間及排定的行程 下載新聞和氣象資訊並唸給你聽 播放影片及音樂 追蹤使用者的方向 生動地與使用者交談 系統組成 半反射鏡面與液晶顯示器 有強光的房間(左)反射的光較多,在鏡中只會看見自己的影像;光線很微弱的房間(右)內之人物,由於光度很低,因此左邊房間看不到右房間內之影像 當後方的影像顯示裝置關閉時,如同一般鏡子;當顯示裝置投影成像時,使用者可看見成像的資訊內容 自動語音辨識 語音辨識( specch recognition)讓電腦理解人類的語言 隱藏式馬可夫模型(hidden Markov model, HMM) 是語音辨識系統的主流 偵測環境噪音大小及輸入訊號大小,判斷當時是否有正確的交談或命令正被輸入 利用梅爾倒頻譜(Mel Ceptrum)特徵參數做為辨識特徵 採用次音節模型,將中文分成母音和子音,以次音節為單位建構 自動語音辨識處理系統 語音及唇形合成 語音合成(Speech synthesis)將文字轉換成語音輸出 對文章段落進行特殊符號、斷詞、斷句分析,再根據文本劃分轉換成相應的讀音 把文字碼轉換成對應的音碼,再透過語音韻律規則資料庫演算出準確的音高、音長、音強與音節間的停頓長短 3D虛擬精靈的唇形特徵參數 拍攝唇形變化影片擷取62 個唇形特徵點變化參數,另外將40 個聲學模型分別拍攝發音的唇形影帶,偵測唇形周圍特徵點的變化 在3D 模型中定義62 個特徵點的位置,依發出之聲音決定特徵點的位置變化,進而模擬出唇形之變化 影像處理 透過內建攝影機抓取使用者的臉部影像,在對話中進行影像追蹤 使得3D虛擬精靈在對話中能注視著使用者 使用膚色來偵測人臉,容易遭受光源位置與亮度的影響 偵測資訊需不會隨著亮度、人臉形狀與複雜背景的改變而改變 人臉偵測採用G(green)灰階影像做為發展人臉偵測與特徵點擷取的主要參考資訊 未來技術發展 語音辨識受限於吵雜的環境所導致的雜訊干擾 影像辨識受限於影像解析度、複雜的背景與亮度,使得參考資訊不足 互動式多媒體鏡面系統的技術非常廣泛且龐大,如何整合相關的技術,並達到人性化、最佳化、低成本的目標是未來致力研究的方向 * * 出處:《科學發展》2008年10月,430期,36 ~ 41頁 作者:黃建霖、丁俊仁、林基焜、楊家輝、吳宗憲 機構:成功大學電機系及資工系 ㄒ ㄩㄢˊ 子音 母音 次音節1 次音節2 梅爾倒 頻譜 參數比對 能量偵測 RGB Y R G B
文档评论(0)