2006模糊理论及应用研讨会.DOCVIP

  • 1
  • 0
  • 约1.26万字
  • 约 14页
  • 2018-12-29 发布于天津
  • 举报
2006模糊理论及应用研讨会

Study on Separating Mixed Frog Sounds Using Sparse Non-negative Matrix Factor 2-D Deconvolution Combined With Mask Wen-Ping Chen1,*, Cheng Chung Chang1, HYPERLINK .tw/ec/ecjnlSearchResult.aspx?st=asc=ask=%e5%91%a8%e5%af%8c%e4%b8%89so=tsl=allsat=allsdo=allpg_size=20sys=sms=sye=sme=st1=st2=st3=sf1=sf2=sf3=sc1=sc2=smode=dtype=1sysid=1sysl=CH Fu-Shan Chou2, Ya-Zhung Chen1, and Wen-Chih Lin2 1Department of Electrical Engineering, National Kaohsiung 2Liu-Kuei Research Center, Taiwan Forestry Research Institute E-mail: pen@.tw 摘要 (Abstract) 野外錄製的聲景資料音檔中,時常會出現異種生物鳴叫的混音聲,進而影響聲紋辨識效果,因此這些混音檔必須進行盲訊號分離,以提高系統的辨識結果。 本論文利用稀疏雙反旋積非負矩陣分解法結合遮罩進行單通道的盲訊號分離,藉以提升訊號分離後的品質。本研究對八種蛙類進行七種的混音項目,並對七種混音項目進行盲訊號分離以及聲紋辨識。實驗將分離後之訊號,各別切出410個音節,進行聲紋辨識實驗,經實驗後發現,稀疏雙反旋積非負矩陣分解法與本論文所提出之方法所分離的訊號之平均辨識率分別為49.43%與79.27%,結果證明本方法能有效改善分離訊號的品質以提升辨識系統的正確率。 關鍵詞: 單通道盲訊號分離、非負矩陣分解法、遮罩 前言 (Introduction) 聲紋辨識技術日趨成熟,然而在野外所錄製的聲景資料中,時常夾帶多種蛙類齊鳴之現象,這將導致電腦語音信號處理之複雜度提升,一般通常利用盲訊號分離(Blind Source Separation, BSS)的技術將混音進行分離,目前多通道的盲訊號分離已經有許多的研究文獻被提出,而獨立成分分析法(Independent Component Analysis, ICA)[1-2]是最被廣泛應用於盲訊號分離之研究,至於單通道訊號分離還是屬於發展當中的領域,目前有一些學者對於單通道訊號分離的問題,提出一些方法。 2001年時,Michael等人[3]利用獨立子空間分析(Independent Subspace Analysis, ISA)對單通道混合聲音進行訊號分離,首先將時域訊號轉換為時頻訊號(Spectrogram),以主成分分析法(Principal Component Analysis)與獨立成分分析法找出一組獨立基底向量(Independent Basis Vectors),並利用以獨立基底向量之交叉熵所組成的分區矩陣來對獨立基底向量進行相似度的分類,再將分類後的獨立基底向量進行逆轉換取得分離的訊號。 2003年Bonaroya等人[4]利用溫尼濾波器的想法,對於兩種樂器混在一起的音樂進行分離,在訓練階段找出各樂器的功率頻譜密度(Power Spectrum Density)經過特徵萃取得到特徵並存入資料庫,分離訊號時,將資料庫的特徵值取出進行特徵權重計算,直到特徵值與權重值的線性疊加結果接近混合訊號,此權重值即為答案,再利用特徵值與權重值進行分離的運算,但是此方法只適用於兩種訊號的混音進行分離,並且還必須事先知道樂器的種類才能進行分離,因此這方法對於未知的蛙類進行混音分離則不適合。 2004年Paris[5]將非負矩陣分解法(Non-negative Matrix Factorization, NMF)結合反摺積(Deconvolution)獲取頻譜上的時間變化,成功的從單通道混音訊號中擷取出鼓聲,此方法雖然有不錯的效果,但是其稀疏程度不能受到控制,因此有時較容易有模糊(Ambiguity)狀態發生。2006年M. Morup[6]提出了稀疏雙反旋積非負矩陣分解法(Sparse Non-negative Matrix Factor 2-D Deconvolution , SNMF2D),將非負矩陣分解法加入了雙反旋積的運算,並且為了能夠控制分解結果的稀疏性,因此還加入了稀疏性的控制項[7-8],使得分析後的資料,除了能夠得到頻譜的時間資訊與音高的變化之外,並藉由稀疏的控制因子使得資料更局部性的呈現,將混合的蛙聲利用稀疏雙反旋積非負矩陣分

文档评论(0)

1亿VIP精品文档

相关文档