- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
进度报告语音讯号处理
進度報告語音訊號處理 報告人:賴長柏 指導教授:陳有圳 教授 報告時間:2008/11/05 第一章 緒論 用電腦技術來處理語言問題的最終目的,希望人類與機器可以用自然語言來溝通。 1.2 語音處裡的幾個技術 語音編碼(speech coding) 將聲波訊號轉變成為電的訊號,如電流或電壓,再經過一個類比到數位轉換器(analog-to-digital converter,ADC),變成數位的表達方式。 最基本的試用脈碼調變的方式來記錄聲音的波形。 語音合成(speech synthesis) 文句轉語音系統(text-to-speech system, TTS system)是將每個字(character)或詞(word) 為合成單位,轉換成以語音合成的參數,串接起來合成整句話。 例如”XXX號請到X號櫃檯辦理” 語音辨認(speech recognition) 讓機器聽懂人說的話,就是自動語音辨認(automatic speech recognition, ASR) ,一般的語音辨認單位(speech recognition unit)是音素、次音節、音節、或詞。 語音增強(speech enhancement) 語音中含有背景噪音(background noise),而語音訊號增強就是要抑制噪音,使語音變得更清晰。 說話人辨認(speaker recognition) 在許多應用的場合,需要認出說話人是誰,或是對一個宣稱他是誰的人,從他說話的聲音來確認是否真的就是這個人,前者是說話人的識別(speaker identification),後者是說話人的確認(speaker verification)。 第二章 語音的產生與語音學 人類能以語言溝通,進而累積知識,形成文化,就是因為人類具有比其他生物優越的發音器官。 人類的發音器官能夠產生多樣性的聲音,構成豐富的詞彙。 2.1 人類的發音器官 發音的過程大致如下: (1)空氣經過聲帶(vocal folds),氣流通過時會使得開口變成一開一閉的週期性動作,造成週期性的激發氣流,產生聲音。 (2)振動的氣流會在口腔內產生共振(resonance)現象,由嘴唇出去,型成有近似週期性的聲音,稱為元音或母音 (vowel)。 (3)氣流進入口腔時,將舌頭提起,使口腔與鼻腔相通,則鼻腔的共振會改變口腔內的共振現象,傾向於將低頻成分壓低,就會發出鼻音(nasal)。 (4) 讓口腔中某些部位,將氣流先暫時堵住再放開,產生亂流,這類聲音會發生在母音之前或之後,稱為輔音或子音(consonant),其實就是對母音作修飾的動作。 2-3. 聲學語音學 元音 發元音時,聲帶振動,音強也較大,波形上可以看到大的呈現週期性振幅。其週期就是音高週期,對應的頻率就是基頻,通常以F0表示。 正常說話時,元音的音長大約是50到400ms之間。 表2-4 各元音的前三個共振峰平均頻率(Hz) 輔音 輔音是對元音的前或後作修飾。 帶聲的輔音會有類似元音的共振峰,因為聲帶振動,所以和元音一樣有諧振的成分,但相對於元音,能量小得多。 第五章 短時段之語音處理 我們在處理語音訊號時,通常是一小段一小段地觀察語音訊號的變化,也就是以音框為單位,對每一音框內的訊號,抽取出代表語音的特徵參數,這就是短時段之語音處理。 5.1 離散時間訊號 ADC 類比到數位轉換器(analog-to-digital converter ) 如數位錄音機,將麥克風取到的類比訊號,經過ADC轉換成數位訊號。 DAC 數位到類比轉換器(digital-to-analog converter) 例如從CD光碟裡,取出數位訊號,經由DAC轉成電流類比訊號,去推動喇叭輸出聲音。 將類比訊號轉換成數位訊號的過程,需經過兩個步驟,就是取樣(sampling)與量化(quantization)。 取樣 就是以固定的時間間隔,將類比訊號的振幅記錄下來。將類比訊號乘上一個週期性的脈衝訊號,得到一序列的脈衝, 而脈衝的大小就代表類比訊號的振幅。 這個訊號在時間軸上是不連續的,稱之為離散時間訊號(discrete-time signal),其取樣的週期為Ts,取樣頻率(sampling frequency)就是Fs=1/Ts。 5.2 脈碼調變(PCM) 一個訊號取樣之後變成離散時間訊號,用數位方式來表示這個離散時間訊號上的每個取樣值。 量化 只用固定數目的位元來表示這些取樣值,那麼這些二進數字就只能代表固定的幾個電位值, 這個轉換就叫做量化。 均勻量化 這種量化方式是採用固定的量化間距,劃分的每個格子是一樣的寬度。 訊噪比SNR 其訊號強度對噪音強度的比值,就
文档评论(0)