一種基于哼唱的音樂檢索 一種基于哼唱的音樂檢索方法.pptVIP

  • 0
  • 0
  • 约1.01千字
  • 约 13页
  • 2018-04-06 发布于四川
  • 举报

一種基于哼唱的音樂檢索 一種基于哼唱的音樂檢索方法.ppt

一種基于哼唱的音樂檢索方法 李明 顏永紅 簡介 哼唱檢索系統 旋律提取:基于突出度的音符切分方法 旋律搜索:從旋律快速定位到由粗至精的搜索策略 歌曲資料庫 旋律提取方法 採用的是諧波和能量與基頻相結合的切分方法 諧波和能量突出度切分方法 人在視覺上根據曲線切分音符時的判斷方法 曲線在某個部分是否存在明顯的波谷或者這個部分是否有明顯的突起 比較突起部分的面積和設定的標準突起面積之間的大小來判斷,如果大於則認為突起很明顯,存在音符分割點,否則不存在音符分割點 判斷上有很大的便利性 突出度計算方法:δ=SB/SD 旋律搜索方法 旋律搜索方法第一步: 旋律因子的快速定位 將相鄰音符的音高差作為旋律的最基本單元 每三個音高差組成一個旋律三因子,以此類推可以得到旋律四因子和旋律五因子。 旋律因子投票算法: 在旋律因子任何可能出現的位置,檢查在其前后一定範圍內每個旋律因子與當前位置旋律因子的位置關係。 如果兩者滿足時序性限定條件,則該位置被投一票。 與鄰近的位置關係一致性越強,則該位置得到的投票越多。 每個位置上的得票數=三個旋律因子表對該位置投票的總和。 旋律因子投票算法 旋律搜索方法第二步: 音高輪廓的匹配方法 採用音高輪廓的面積差計算兩段旋律之間的相似度。 查詢旋律的音高差序列為X={x1,x2,…,xN}, 樂曲中對應的音高差序列為Y={y1,y2,…,yN} 旋律搜索方法第三步: DTW匹配搜索 實驗 4男3女在辦公室安靜條件下錄製 16K Hz 16bit , Windows PCM格式 每個測試者哼唱100個旋律片段,每次8秒以上,唱歌詞或是只哼唱旋律 有效片段有692個,平均長度12秒 資料庫有1080首 系統的前十名辨識率為85% 實驗結果 結論 本文提出了一個完整的哼唱音樂檢索系統 對於音符切分,提出了基于突出度的切分算法 在旋律搜索方面 採用運算量最小的旋律因子投票法進行初步搜索,定位出哼唱旋律可能出現的位置 然後採用運算量適中的音高輪廓匹配法進一步進行篩選 最後採用運算量最大的DTW方法進行精細匹配,給出系統最終的候選輸出。 實驗結果顯示檢索結果不斷優化的過程. * * 發音段檢測 基于突出度的音符初切分 基于基頻的音符細切分 音符的歸併和取消 時頻能量 基頻曲線 時間長度K=15,突出度α=1.07,三角形C斜率倒數β=1.43

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档