阶层式群聚演算法应用於蛙类声纹辨识之研究-1010810.DOC

下载文档

3
0
约7.55千字
约 4页
2017-08-04 发布于天津
举报
版权申诉
保障服务

阶层式群聚演算法应用於蛙类声纹辨识之研究-1010810.DOC

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

階層式群聚演算法應用於蛙類聲紋辨識之研究 *a、陳松雄b、林文智c、a 國立高雄應用科技大學電機工程系a 修平科技大學資訊網路技術系b 林業試驗所六龜研究中心c 摘要—聲紋辨識是解決龐大的野外錄音檔重要之研究。在眾多研究中，將平均頻譜以多階段方式呈現之多段式平均頻譜法，其目的是將整體平均頻譜分成多個階段的平均頻譜，期望保留頻率與時間相對關係。但由於每種蛙類的音框頻譜特徵不盡相同，採取固定的階段數並不適合。因此本文提出以階層式群聚演算法找出每種蛙類之音框頻譜特徵分群數，並加入多段式平均頻譜法來改善。經實驗結果發現，多段式平均頻譜法辨識率為93.84%，而本文提出方法可達94.99%。關鍵字 : 聲紋辨識、階層分群法、多段式平均頻譜法簡介隨著科技的發展，資通技術逐漸應用在各個領域上，在生態調查方面上，利用感測元件獲取野外聲景資料，並利用網路技術回傳至資料庫中儲存，可取代傳統人力、物力之生態調查方式。然而龐大的聲景資料量對於人力與時間分析上將造成重大負擔，因此為協助生態研究人員更有效率的分析資料，國內外專家學者提出聲紋辨識方法[1-4]來解決龐大聲景資料的分析。早期的語音辨識比較常見是以動態時軸扭曲法(Dynamic Time Warping, DTW)[5-6] 當作辨識的演算法。在生物聲紋辨識中，也有專家學者提出了一些方法，如Taylor等人[1]對於澳大利亞的22種蛙類，提出一套辨識系統，這套系統將時域信號轉換成頻譜信號，將頻譜上的波峰高點當作其辨識特徵，並利用Quinlan機器學習系統進行辨識蛙類的工作。Tyagi等人[4]則提出一種以音節表示的特徵萃取方法-整體平均聲紋頻譜法(Spectral Ensemble Average Voice Prints, SEAV)，將音節中每個音框內的頻譜做加總並取其平均值，在分類時採用板模匹配[7]方法進行，計算音節之間的歐幾里得距離，由於某些物種的發音頻率變化是非固定的，求取整體平均的頻譜方式將會遺失時間與頻率的相對關係。以圖一及圖二梭德氏赤蛙與腹斑蛙之鳴叫波形為例，其時域信號(圖一(a)與圖二(a))與時頻圖(圖一(b)與圖二(b))是相異的，但其整體平均頻譜(圖一(c)與圖二(c))卻是相近的，若單以整體平均頻譜特徵來做辨識，可能會造成物種辨識不精確，故Chen等人[8]提出了多段式平均頻譜法(Multi-Stage Average Spectral, MSAS)，將整體平均頻譜分成多個階段的平均頻譜，期望保留其時間關係，但由於每種蛙類其頻譜變化差異大，對每種蛙類採取固定階段來進行訓練並不合適，故本文利用MSAS結合群聚技術 [9]做 (a) 時域訊號 (b) 時頻圖 (c) 整體頻譜圖一：梭德氏赤蛙鳴叫訊號 (a) 時域訊號 (b) 時頻圖 (c) 整體頻譜圖二：梭德氏赤蛙鳴叫訊號適應性的分群，改善成適應性多段式平均頻譜法(Adaptive Multi-Stage Average Spectral, AMSAS)以期望提升辨識效果。群聚技術的目的在分析資料的內容，將性質相似的資料群聚在一起。較常見的群聚技術有切割式群聚演算法(Partition Clustering Algorithms)與階層式群聚演算法(Hierarchical Clustering Algorithms)，切割式群聚演算法必須先決定所要分割的群聚數目，再以重心點基礎(Centroid based)的方式進行分群。階層式群聚演算法是透過一種階層架構的方式，將資料層層反覆地進行分裂或聚合直到達成條件才終止分群。但切割式群聚演算法需要事先決定群聚數目，並不符合適應性的目的，故選擇階層式群聚演算法。研究方法本文所提出之蛙類聲紋辨識系統分成三個部份處理，首先是語音訊號前處理，再來根據不同種蛙類之聲紋頻譜特性做階段數之判別，最後再由MSAS來執行模板訓練以及分類之工作，整體工作流程如(圖三)所示，其詳細說明如下: 圖三：系統辨識流程 2.1 訊號前處理聲音訊號從空氣中傳送到錄音設備時，訊號的高頻能量逐漸會衰減，為了還原聲音訊號，而對錄製的訊號作高頻補償的處理，稱為預強調(Pre-emphasis)。此程序可視為將訊號通過一組高通濾波器，其經過預強調後之信號如下： (1) 其中s(n)為原始訊號，α值介於0.9~1之間的常數。由於聲音訊號是屬於非穩態訊號(non-stationary signal)，但在短時間區段裡，聲音訊號變化不大，因此為了要求其穩定性，則對訊號做音框化的處理，為了要呈現聲音訊號之時間變化情形，會將每個音框重疊若干部分，此外，為消除音框兩端的邊緣效應，每個音框需進行加窗處理。其中漢明窗(Hamming Window)是最常使用的加框處理方式。其經過加框處理後之信號為：