鉴别式语言模型於语音辨識结果重新排序之研究.PDFVIP

下载本文档

0
0
约4.99万字
约 20页
2019-01-29 发布于湖北
举报
版权申诉

鉴别式语言模型於语音辨識结果重新排序之研究.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

鑑別式語言模型於語音辨識結果重新排序之研究 Exploiting Discriminative Language Models for Reranking Speech Recognition Hypotheses 劉家妏 Chia-Wen Liu 國立臺灣師範大學資訊工程學系 Department of Computer Science and Information Engineering National Taiwan Normal University 697470171@.tw 林士翔 Shih-Hsiang Lin 國立臺灣師範大學資訊工程學系 Department of Computer Science and Information Engineering National Taiwan Normal University 896470017@.tw 陳柏琳 Berlin Chen 國立臺灣師範大學資訊工程學系 Department of Computer Science and Information Engineering National Taiwan Normal University berlin@.tw 摘要任何語言都有許多潛在的規律性，若能擷取與分析這些特性，電腦就能進一步被用來理解人類語句或自動產生能表達某種語意的語句。統計式語言模型 (Statistical Language Models)透過機率模型的建立來描述語言生成的規律性，其模型參數可由大量的文字語料庫所訓練而成。語音辨識常使用 N 連(N-gram)語言模型，它以估測每一個詞在其先前緊鄰 N-1 個詞已知的情況下出現的條件機率，來判斷語音辨識結果的可能性；但因其訓練並不是以降低語音錯誤率為目標，導致在語音辨識效能表現上有所侷限。有別於傳統 N 連語言模型，近年來有許多直接以最小化語音辨識錯誤率為目標的鑑別式語言模型(Discriminative Language Model)被提出。本論文介紹了多種基於不同訓練精神的鑑別式語言模型，並比較與討論它們在中文大詞彙連續語音辨識上的表現。另外，我們提出語句相關之鑑別式語言模型，改進了傳統鑑別式語言模型在測試過程中所有測試語句皆使用相同語言模型特徵權重參數向量的缺點，讓不同測試語句擁有各自的組合係數來線性結合不同訓練語料所訓練而得的語言模型特徵權重參數向量，以期新的權重參數向量能更加符合測試語句的特性。實驗結果顯示本論文所提出的語句相關之鑑別式語言模型，相較於僅使用三連語言模型、或使用傳統鑑別式語言模型的基礎大詞彙連續語音辨識系統，能有相當程度的語音辨識率提升。關鍵詞：語音辨識、語言模型、鑑別式語言模型、重新排序。一、緒論語言是人類最自然且直接的溝通方式，而如何讓電腦達到如人類般具備「聽、說、讀、寫」能力就是語音處理領域長期以來努力的目標。為了讓電腦擁有此能力，首先要做到的便是如何讓它能夠「聽」懂使用者的語音輸入；而將語音訊號轉換成文字的過程，須透過自動語音辨識(Automatic Speech Recognition, ASR)來達成。為此，我們首先須將聲音數位訊號經由特徵擷取(Feature Extraction)而產生出能代表語音的聲學特性(Acoustic Characteristics)且易於電腦處理的聲學特徵向量；接著，將聲學特徵向量透過機率模型建立起其對應的聲學模型(Acoustic Model) ，串連起聲音與文字間的對應關係；最後，再由使用大量文