- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
以高斯混合模型表征器与语言模型为基础之语言辨认language
以高斯混合模型表徵器與語言模型為基礎之語言辨認
Language Identification based on Gaussian Mixture Model Tokenizer
and Language Model
張智傑 、王小川
Zhi-Jie Chang and Hsiao-Chuan Wang
國立清華大學電機工程學系
Department of Electrical Engineering, National Tsing Hua University
E-mail : piscesboy@micro.ee.nthu.edu.tw hcwang@ee.nthu.edu.tw
摘要
本論文探討 不需要標注資料的自動化語言辨認方法 ,基本觀念是建立高斯混合模型之表徵
器 ,以表徵器輸出建立語言模型,加上切割處理與後端處理 ,提升語音資料的語言辨認 正確率 。
所建議的系統架構 ,分別是串聯高斯混合模型表徵器和語言模型的 “高斯混合模型表徵器語言-
模型法”,以及將語言模型融合在表徵器裡面的 “連結聲學語言模型法- ” 兩種型式。由實驗結果
觀察 ,加入切割處理的幫助 ,的確能夠提升系統的辨認 正確率。
關鍵詞 :語言辨認 、高斯混合模型 、表徵器、語言模型
一、緒論
近代語言辨認的方式 ,主要是對訓練語音資料,轉換成類音素 ( phone-like ) 序列,以類音
素序列建立 N-連文模型作為語言模型 。在做語言辨認時 ,計算測試語音之類音素序列與語言模
型之間的相似度 ,經過後端處理做出語言辨認的判斷 所建議的系統有連結語言模型的音素。 辨認
法 ( PRLM, Phone Recognition Language Model )[1][2] 、連結語言模型的平行音素辨認法( PPRLM,
Parallel-language PRLM )[ 1][2] 、高斯混合模型表徵器語言模型法- ( GMM-tokenizer-language
model ) [2][3] 、以及連結聲學語言模型法- ( Joint-Acoustic Language Model ) [4] [5] 等方式。
連結語言模型的音素辨認法 [1]是將輸入語料經過預先訓練好的音素辨認器 ( phone
recognizer ) ,得出輸入語料的音素序列 ( phone sequence ) ,再由音素序列 統計產生語言模型
( language model ) 。在辨認過程中 則是, 計算測試語音的音素序列 與 N-連文法 ( N-gram語言模)
型的相似度 ( likelihood ) ,對應相似度最高的語言模型 ,就是 辨認結果 。圖一是 以中英日 三個
語言的辨認為例 ,展示語言辨認系統之示意圖 輸入的測試語音。 ,分別經由中英日三個語言的音
素辨認器,產生三個不同的音素序列,將這三個不同的音素序列分別輸入到三個語言所建立的語
言模型 ,得出九個相似度值 ,後端處理器對這九個相似度值做運算 ,產生最後的辨認結果。
圖一 、連結語言模型的音素辨認法
表徵器語言模型法的系統- ,需要有標註好的訓練語料做為音素辨認器訓練 之用 ,要 人工的
介入才能完成系統建構 ;因此有研究者提出基本概念相似 ,但不需人工幫助的高斯混合模型表
徵器語言模型系統- 。其作法是將高斯混合模型的各個高斯機率密度函式 (Gaussian probability
density function)視為 一個量化單位 ,給予模型中的每個高斯分布固定的表徵 ( token ) 值 ,將一
個音框在各個高斯分布的機率值計算出來後 ,選擇機率最大的高斯分布作為表徵,視為此音框的
代表值 。對於輸入的測試語料 ,以高斯混合模型的表徵值序列 ( token s
您可能关注的文档
- 人力资源管理师-基础知识复习题兰州教益人力资源中心.doc
- 2017年上海师范大学本科课程标准试行-上海师范大学数理学院.doc
- 2017年5月校刊-北京启喑试验学校.pdf
- 2017年上半年国家职业资格统一鉴定部分职业二级.doc
- 2016秋交换生简章.pdf
- 人体研究法简介.pdf
- 2017年企业质量信用报告-山东松竹铝业股份有限公司.doc
- 2017年合肥社会服务人才培训计划-合肥人力资源和社会.doc
- 2017年成都龙泉驿区面向社会公开招聘卫生事业-龙泉驿区中医院.doc
- 人工触发闪电与降雨倾泻-高原气象.pdf
- 2024年江西省高考政治试卷真题(含答案逐题解析).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)物理试卷(含答案详解).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)地理试卷(含答案详解).pdf
- 2024年内蒙通辽市中考化学试卷(含答案逐题解析).docx
- 2024年四川省攀枝花市中考化学试卷真题(含答案详解).docx
- (一模)长春市2025届高三质量监测(一)化学试卷(含答案).pdf
- 2024年安徽省高考政治试卷(含答案逐题解析).pdf
- (一模)长春市2025届高三质量监测(一)生物试卷(含答案).pdf
- 2024年湖南省高考政治试卷真题(含答案逐题解析).docx
- 2024年安徽省高考政治试卷(含答案逐题解析).docx
文档评论(0)