技术写作.ppt

下载文档 降价啦

8
0
约1.33千字
约 13页
2017-03-15 发布于天津
举报
版权申诉
保障服务

技术写作.ppt

1、本文档共13页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

技术写作.ppt

魔鏡科技文選II教材任職單位：資訊工程系報告者：王木良報告日期：2007/03/04 大綱系統簡介半反射鏡面與液晶顯示器自動語音辨識語音及唇形合成影像處理未來技術發展系統簡介在「優質數位生活體驗屋」，成大電機系及資工系共同研發展示之多媒體人機互動系統提供服務提供虛擬精靈對話功能語音聲控操作及回應查詢時間及排定的行程下載新聞和氣象資訊並唸給你聽播放影片及音樂追蹤使用者的方向生動地與使用者交談系統組成半反射鏡面與液晶顯示器有強光的房間（左）反射的光較多，在鏡中只會看見自己的影像；光線很微弱的房間（右）內之人物，由於光度很低，因此左邊房間看不到右房間內之影像當後方的影像顯示裝置關閉時，如同一般鏡子；當顯示裝置投影成像時，使用者可看見成像的資訊內容自動語音辨識語音辨識( specch recognition)讓電腦理解人類的語言隱藏式馬可夫模型(hidden Markov model, HMM) 是語音辨識系統的主流偵測環境噪音大小及輸入訊號大小，判斷當時是否有正確的交談或命令正被輸入利用梅爾倒頻譜(Mel Ceptrum)特徵參數做為辨識特徵採用次音節模型，將中文分成母音和子音，以次音節為單位建構自動語音辨識處理系統語音及唇形合成語音合成(Speech synthesis)將文字轉換成語音輸出對文章段落進行特殊符號、斷詞、斷句分析，再根據文本劃分轉換成相應的讀音把文字碼轉換成對應的音碼，再透過語音韻律規則資料庫演算出準確的音高、音長、音強與音節間的停頓長短 3D虛擬精靈的唇形特徵參數拍攝唇形變化影片擷取62 個唇形特徵點變化參數，另外將40 個聲學模型分別拍攝發音的唇形影帶，偵測唇形周圍特徵點的變化在3D 模型中定義62 個特徵點的位置，依發出之聲音決定特徵點的位置變化，進而模擬出唇形之變化影像處理透過內建攝影機抓取使用者的臉部影像，在對話中進行影像追蹤使得3D虛擬精靈在對話中能注視著使用者使用膚色來偵測人臉，容易遭受光源位置與亮度的影響偵測資訊需不會隨著亮度、人臉形狀與複雜背景的改變而改變人臉偵測採用G(green)灰階影像做為發展人臉偵測與特徵點擷取的主要參考資訊未來技術發展語音辨識受限於吵雜的環境所導致的雜訊干擾影像辨識受限於影像解析度、複雜的背景與亮度，使得參考資訊不足互動式多媒體鏡面系統的技術非常廣泛且龐大，如何整合相關的技術，並達到人性化、最佳化、低成本的目標是未來致力研究的方向 * * 出處：《科學發展》2008年10月，430期，36 ~ 41頁作者：黃建霖、丁俊仁、林基焜、楊家輝、吳宗憲機構：成功大學電機系及資工系ㄒㄩㄢˊ 子音母音次音節1 次音節2 梅爾倒頻譜參數比對能量偵測 RGB Y R G B