- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
鑑別式語言模型於語音辨識結果重新排序之研究
Exploiting Discriminative Language Models for Reranking
Speech Recognition Hypotheses
劉家妏 Chia-Wen Liu
國立臺灣師範大學資訊工程學系
Department of Computer Science and Information Engineering
National Taiwan Normal University
697470171@.tw
林士翔 Shih-Hsiang Lin
國立臺灣師範大學資訊工程學系
Department of Computer Science and Information Engineering
National Taiwan Normal University
896470017@.tw
陳柏琳 Berlin Chen
國立臺灣師範大學資訊工程學系
Department of Computer Science and Information Engineering
National Taiwan Normal University
berlin@.tw
摘要
任何語言都有許多潛在的規律性,若能擷取與分析這些特性,電腦就能進一步被
用來理解人類語句或自動產生能表達某種語意的語句。統計式語言模型
(Statistical Language Models)透過機率模型的建立來描述語言生成的規律性,其模
型參數可由大量的文字語料庫所訓練而成。語音辨識常使用 N 連(N-gram)語言模
型,它以估測每一個詞在其先前緊鄰 N-1 個詞已知的情況下出現的條件機率,來
判斷語音辨識結果的可能性;但因其訓練並不是以降低語音錯誤率為目標,導致
在語音辨識效能表現上有所侷限。有別於傳統 N 連語言模型,近年來有許多直
接以最小化語音辨識錯誤率為目標的鑑別式語言模型(Discriminative Language
Model)被提出。本論文介紹了多種基於不同訓練精神的鑑別式語言模型,並比較
與討論它們在中文大詞彙連續語音辨識上的表現。另外,我們提出語句相關之鑑
別式語言模型,改進了傳統鑑別式語言模型在測試過程中所有測試語句皆使用相
同語言模型特徵權重參數向量的缺點,讓不同測試語句擁有各自的組合係數來線
性結合不同訓練語料所訓練而得的語言模型特徵權重參數向量,以期新的權重參
數向量能更加符合測試語句的特性。實驗結果顯示本論文所提出的語句相關之鑑
別式語言模型,相較於僅使用三連語言模型、或使用傳統鑑別式語言模型的基礎
大詞彙連續語音辨識系統,能有相當程度的語音辨識率提升。
關鍵詞:語音辨識、語言模型、鑑別式語言模型、重新排序。
一、緒論
語言是人類最自然且直接的溝通方式,而如何讓電腦達到如人類般具備「聽、說、
讀、寫」能力就是語音處理領域長期以來努力的目標。為了讓電腦擁有此能力,
首先要做到的便是如何讓它能夠「聽」懂使用者的語音輸入;而將語音訊號轉換
成文字的過程,須透過自動語音辨識(Automatic Speech Recognition, ASR)來達成。
為此,我們首先須將聲音數位訊號經由特徵擷取(Feature Extraction)而產生出能代
表語音的聲學特性(Acoustic Characteristics)且易於電腦處理的聲學特徵向量;接
著,將聲學特徵向量透過機率模型建立起其對應的聲學模型(Acoustic Model) ,串
連起聲音與文字間的對應關係;最後,再由使用大量文
文档评论(0)