- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
使用线频谱频对和支持向量机在语者密码验证之研究-npucsie
第八屆離島資訊技術與應用研討會論文集
使用線頻譜頻對和支持向量機在語者密碼驗證之研究
陳璽煌 羅育仁
樹德科技大學 資訊工程學系 樹德科技大學 資訊工程學系
shchen@.tw .tw
摘要 in)與辨識(Recognition) 。登入程序是建構語者的模
型 ,此階段能捕捉語者的特性,語者必須提供適當
語者辨識技術目前已廣泛地應用在許多語音 的聲音語料,如:連續的數字串或句子、片語的參
相關應用系統上,比如說銀行業務的電話語音系統 數。然後利用這些語者特性的參數去建立一個模
以及門禁安全認證系統等等,不過現有的語者辨識 型,來鑑定說話時的語音。在辨識程序中,輸入語
技術在安全性上仍有很大的改良空間。因此,本論 者語音的特徵將用來檢查是否吻合語者的模型。換
文提出一種利用線頻譜頻對(LSFs )和支持向量機 句話說 ,就是對測試的語句作進行特徵參數擷取,
(SVM )來開發一種可辨識語者特定密碼的新型演 之後與訓練好的各語者模型比對,得到個別相似度
算法。首先,本演算法採用語者選擇的語音字句為 的分數,分數最高的語者即為辨識結果。一般的做
密碼,然後利用 SVM 來針對語者語音密碼的 LSFs 法是根據一個聲學相似度所設定的門檻去決定是
進行訓練,進而產生了語者語音密碼的特徵模型, 否接受所驗證的語者。常見的語者辨識系統是使用
之後就可區別是語者本人或其他冒充者。實驗採用 隱藏式馬可夫模型 (Hidden Markov Model ;HMM)
Aurora- 2.0數位語音資料庫進行測試,由實驗結果 與高斯混合物模型(Gaussian Mixture Model ;GMM)
顯示,在僅使用 8-階 LSFs的情況下,本論文提出 來執行相似度的驗證[2] ,此方法的缺點在於當測試
之語者驗證演算法得到 2.78%的錯誤率相同點 者增加時,會有過度的分類的問題產生,導致無法
(EER) ,且在錯誤接受率(FAR)及錯誤拒絕率 (FRR) 區分是語者本人或是其他冒充者。
都有明顯改。
關鍵詞 :線頻譜頻對、支持向量機器、語者驗證。
1.前言
語者辨識技術根據其性質不同可分為兩類應
用:語者識別 (Speaker identification)和語者驗證
(Speaker verification) 。儘管這兩種系統的應用目標
幾乎是大不相同,但這兩種系統都使用類似的技
術。語者識別是指在一群人中找出一個聲紋特性與
辨識語音最相近的語者,相當為多選一的問題。語
者驗證則是根據語者的語音及其所宣告的身份,判 圖 1. 傳統的語者辨識系統
別是否就是他所宣告的語者,這種情況就好像是非
此外,語者特性與特徵值的選擇是另一個關鍵
題,最後只能選擇接受或是拒絕。目前語者識別和
問題。設定理想的語者之特徵,語者自己本身聲學
語者驗證,技術都已經廣泛地應用於語音系統上,
的變異性 (Inner Speaker Variation)應盡量少,而語者
比如說銀行業務的電話語音系統及安全認證系統
跟語者間聲學上的變異性 (Inter Speaker Variation)應
[1] 。此外,根據不同的辨識目標,辨識語者和驗證
盡量大
文档评论(0)