语音传达系统之设计.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 語音傳達系統之設計 8.1 語音之性質 8.2 語音評鑑之效標 8.3 語音傳遞系統之組件 8.4 合成語音 語音也是聽覺資訊顯示形式之一,其來源可經由人或機器,目前已可用低廉成本的技術來合成語音(如新上市轎車、電信局查號台)﹔電腦語音辨識,目前雖不如合成語音進步,但已有初步成果,因此語音可作為控制機制,以指揮電腦系統運作。 8.1語音之性質 語音是由肺部呼出的氣流,經發音器官修飾,而形成的各種聲波。 8.1.1 語音之類型 語音中最短的分節;這分節一改變,一字的意義便隨而改變。就英語而言,其母音共有十三個音素 (例如put中的u),而子音則有二十四個音素 (例如tie中的t) 和一些雙母音 (例如boy中的oy)。 音素可組成音節 (syllables),再形成字或詞 (words),又構成句 (sentences)。 8.1.2 語音之描述 波形圖 (waveform):如圖8.1 ,表示該聲音在時間過程內空氣壓力 (強度) 的變化。 頻譜圖 (spectrum):如圖8.1 ,表示在某期間取樣之際,發出某音素或字詞所產生的各個頻率的個別強度。 音譜圖 (sound spectrogram):如圖8.1 ,以縱軸表示頻率,橫軸表示時間,所發聲音的強度則以座標圖形墨色的濃淡程度來描述。 8.1.3 語音之強度 個別語音的平均強度或語音功率 (speech power) 之差異非常的大;母音的語音功率通常要比子音的大得多。而不幸地,低語音功率的子音偏巧是語音能解度的關鍵因素。 男性的語音強度約比女性高出3至5 dB,輕聲交談的語音強度約為45 dBA,一般交談約為55 dBA 8.1.4 語音之頻率組成 每一語音均有其獨特的頻譜,人們之間的語音頻譜也自然不同;而同一個人也會因情況之不同而改變其頻譜組成。 一般而言,男性比女性在頻譜上具有較佔優勢的低頻率組成。 8.2 語音評鑑之效標 8.2.1 語音的能解度 係指語音訊息(如一串字列)可被正確辨別與認識的程度,通常句子能解度最高,孤立字其次,無意義音節最差。 如將日常用與抽離原先語脈,約有半數不能理解,故能解度非常仰仗語脈(話語前後關係)與預期(可能話題內容)。 8.2.2 語音品質 語音品質 (speech quality)、自然度 (naturalness) 或傳真性,其重要性不亞於能解度,尤其在必須分辨發話者身份的場合,接聽電話就是一例。 8.3 語音傳遞系統之組件 一套語音傳遞系統係由: 發話者(speaker); 訊息 (message); 傳送系統 (transmission system); 噪音環境 (noise environment);以及 受話者(hearer) 等所構成。 8.3.1 發話者 優秀的」說話者 的發音 (英語) 具有如下的特色: 「音節持續時間」較長,即音節拖得較長。 語音強度較大,即話說得較鏗鏘有力。 用於說話的總時間較長,即較少停頓。 較以基本聲音頻率之不同來變化其語音。 8.3.2 訊息 有數項訊息特性會影響其可理解性,包括所用音素、字詞和語脈。 音素混淆 :某些語音之間比較容易相互混淆。Hull (1976) 發現下列字母組群,在同組群的字母之間很容易彼此混淆:DVPBGCET; FXSH; KJA; MN。 字詞特性 (word characteristics):熟悉的字詞比不熟悉者的可理解性大。 語脈特色 (context feature):完整文句的能解度高於孤立的字詞。 8.3.3 傳送系統 語音傳遞系統 (例如電話和廣播) 可能會產生各種型式的失真,例如頻率失真、過濾、波幅失真等。 過濾對語音的影響:所謂語音過濾,就是在傳送過程中,阻止某些頻率,而僅允許其餘頻率的音波通過。大部分的濾波器不是消除某水準之「上」的頻率 (稱為低通濾波器,low-pass filter),就是消除某水準之「下」的頻率 (稱為高通濾波器,high-pass filter)。 8.3.3 傳送系統 波幅失真對語音的影響:波幅失真的型式之一為尖峰截波 (peak clipping),亦即聲波的尖峰部分皆被截割掉,只有中間部分的聲波被保留下來。中央截波 (center clipping) 則是截割掉波幅的某些中央部分,而保留聲波的尖峰部分。圖8.7即為截波處理對噪音下語音能解度的影響。 8.3.4 噪音環境 噪音,不管是來自外界環境或內在於傳送系統本身,都是妨害語音可理解性的重要原因。 發音清晰指數 (Articulation Index, AI):發音清晰指數 (AI) 可用以預測在一已知噪音水準的環境下語音的能解度。圖8.8為美國國家標準局 (ANSI, 1969) 所使用的三分之一八度音階波

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档