- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
研究计画中英文摘要.doc
AMR-WB語音合成與編譯
計畫書
指導教授:陳福坤
學生:鄭冠瑀目錄
摘要
計畫中文摘要
計畫英文摘要
研究計畫背景及目的
研究計畫之背景及目的
AMR-WB編碼器的組成
AMR-WB編碼器的特點
參考文獻
第三章 研究方法
研究方法
輸入語音的預處理
提取和定量係數
基音提取和激發建設
第四章 預期完成之工作項目與成果
預完成之工作項目
預期成果
(一)計畫中文摘要
隨著計算機技術和信息技術的飛速發展,語音合成技術已成為廣大工
作者關注的焦點。線性預測(LPC)參數的合成法是以其數據率低、複
雜度低、成本低、簡單且直觀等特點在語音合成中受到特別的重視。
但是由於原有模型所提取的參數過於簡單,使得在合成階段很難得到
高品質的合成語音。自適應多速率的寬帶語音編碼技術(AMR-WB)
是一種高品質的數字寬帶語音編碼系統,採用代數碼激勵線性預測
(ACELP)技術,將傳統的200-3400H的帶寬擴展到50- 7000HZ,
在參數提取階段運用閉環和開環相結合的方法計算基音延時,運用自
適應碼本和固定碼本結合的方式還原激勵,為了使合成的語音效果顯
著提高,該技術為改善LPC參數語音合成效果提供了解決的方法。
計畫英文摘要
With the computer technology and the rapid development of information technology, voice synthesis technology has become the work
Authors focus. Linear prediction (LPC) parameters of the synthes is data rate is low, re-Miscellaneous low, low cost, simple and intuitive features such as voice synthesis of particular attention.
However, due to the parameters of the original model is too simple to extract, making difficult to obtain in the synthesis stage
High-quality synthesized speech. Adaptive multi-rate wideband speech coding technology (AMR-WB)
Is a high quality digital wideband speech coding system, the use of algebraic CELP(ACELP) technology, the traditional 200-3400H bandwidth extends to 50 - 7000HZ,In the extraction stage using a combination of closed and open loop method to calculate the pitch delay, the use of self-
Adapted codebook and fixed codebook as the way to restore incentives, in order to effect significant voice synthesis Improve the technology to improve the LPC parameters of speech synthesis, providing a solution.
(二)研究計畫之背景及目的
1.當今使用的大多數語音編解碼系統是基於電話帶寬的窄
帶語音,這種語音帶寬通常被限制在約200Hz一3400Hz,採樣速
率為8kHz。傳統公共交換電話網(PSTN)的這種內在的帶寬限
制限制了通訊質量的進一步提高,致使在語音的自然度、音樂
處理以及一些特殊音處理等方面還不盡人意。
端到端數字網絡的增長,如第二和第三代無線系統、IS一
N、VOIP,允許人們使用一個更寬的語音帶寬來提供PsTN,
可以給人一種面對面交流感覺的通訊質量。儘管許多
語音信號中,尤其是不發聲的信號中,其能量要比7kHz更高,
但實際只以比7kHz低的形式表示。在寬帶語音編解碼中,信
號以16kHz的頻率採樣,帶寬限制在50Hz一70ooHz,這樣的語
音質量接近於面對面交流感覺的通訊質量。同窄帶電話語音
文档评论(0)