语音辨识技术於蓝芽通讯的环境之应用的研究.docVIP

语音辨识技术於蓝芽通讯的环境之应用的研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音辨识技术於蓝芽通讯的环境之应用的研究

PAGE PAGE 1語音辨識技術於藍芽通訊環境之應用研究Applications of Speech Recognition to Bluetooth Wireless Communications譚旦旭 王新富 何元傑 王冠驊 汪千綺 高逸竹國立台北科技大學電機工程系Email: HYPERLINK mailto:thtan@.tw thtan@.tw摘要本論文探討語音辨識技術應用於藍芽通訊環境的可行性。首先,我們應用藍芽系統於多種距離下錄製2男3女的測試語料,並利用HTK模組所訓練的語音參考模型進行模擬實驗。接著我們實作了一套語音控制系統,此系統由藍芽模組、語音辨識模組、控制模組及機械狗組成。模擬與實作系統的測試結果顯示,整合藍芽與語音辨識技術的家庭自動化應用是可行的一個方向。關鍵詞:藍芽、語音辨識、家庭自動化一、簡介經過三十多年來的發展,語音辨識技術已臻成熟的地步[1],目前已有許多語音辨識系統被開發出來,並廣泛地應用在人類日常生活中,例如我們可以使用語音輸入取代按鍵輸入[2]、以聲控方式撥打手機[3]、及以手機進行語音下單[4]等。由手機、個人電腦、消費性電子以及娛樂性產品等,處處可見語音辨識的應用,語音辨識技術不但使正常人的生活更便利,也可大幅提昇殘障人士的生活品質。家庭自動化一直是人類努力追求的目標,也陸續有各式各樣的系統被開發出來。但多數仍受到有線的束縛,且存在控制方式仍需手動按鍵等缺點。為改善上述情況,本研究擬結合藍芽(Bluetooth)無線通訊及語音辨識(Speech Recognition)技術以擺脫有線環境的束縛,進一步提昇家庭自動化的品質。目前整合藍芽及語音辨識之研究尚未見文獻探討,故其應用仍屬萌芽期。由於藍芽需要的功率很低且適用於短距離傳輸,因此符合一般家庭環境之需求,若能輔以語音辨識之便利性,將更具應用價值,可為家庭自動化提供更理想的解決方案。本論文第二節將介紹藍芽無線技術。第三節將敘述語音辨識技術。為了驗證語音辨識於藍芽通訊環境之可行性,第四節將以電腦軟體評估語音辨識率並分析其效能。第五節實作一套無線藍芽語音辨識系統,以語音控制機械狗。第六節為結論。二、藍芽藍芽[5]是一種適用於短距離傳輸(10~100公尺)的低功率無線通訊技術,其使用的2.4 GHz (2.402~2.480 GHz) 頻道為全世界通用的免費ISM (Industrial, Scientific and Medical) 頻帶。為解決公用頻道的干擾問題,藍芽使用跳頻(Frequency Hopping)技術,其工作的2.402~2.480 GHz頻帶被切割成79個各為1 MHz的通道(channel),並以隨機方式選擇通道進行通訊,一般傳輸狀況下跳頻次數為1,600 次/秒,每個時槽(time slot)佔625 μs。藍芽採用分時雙工(Time-Division-Duplex, TDD)及GFSK (Gaussian Frequency Shift Keying)調變技術。藍芽以SCO(Synchronous Connection-Oriented)通道傳送語音,SCO連線屬電路交換的同步傳輸型態,每一條SCO支援64 Kbit/s的語音通話,一旦建立SCO通道,Master和Slave即可直接發送SCO封包,進行單點對單點的對稱連線服務。藍芽使用對數脈波調變(LOG PCM)或連續變化斜率增量調變(Continuous Variable Slope Deltamodulation, CVSD)進行語音編碼,其中CVSD是一種較為強健的語音調變方式,其步長(Step Size)可根據信號強弱趨勢適應性地調整。CVSD編碼器的輸入是每秒64 K取樣的線性PCM訊號,CVSD編碼器先比較輸入信號與前一筆累加器預估信號,若輸入位元大於前一筆累加器輸出位元,編碼器會輸出位元1,否則輸出-1。輸出位元會送回累加器,並預估此次信號輸出的累加值。本論文的藍芽系統採用CVSD語音編碼。藍芽的興起對目前廣被採用的紅外線傳輸技術影響甚鉅,雖然紅外線擁有低成本的優勢,但紅外線傳輸受到須在視線範圍內連線的限制,藍芽則無此限制,且藍芽價格已逐年下降至趨近合理範圍,因此漸有取代紅外線的趨勢。表1比較藍芽與紅外線技術之差異[5-8]。 三、語音辨識技術語音辨識技術主要包括訓練及測試兩大部分,在訓練部分主要是由語音中所萃取出之特徵參數建立相關之語音參考模型,測試部分則是根據訓練所得之模型對測試語料進行辨識。本論文中,語音特徵參數的擷取方法是採用描述人耳聽覺特性的梅爾頻率倒頻譜係數(Mel-Frequency Cepstrum Coefficients),其特徵參數的相關變數設定為32 ms的音框長度、10 ms的音框位移長度、Filt

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档