「多模式音乐检索」系统.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
「多模式音乐检索」系统.ppt

「多模式音樂檢索」系統 國立聯合大學進修推廣部 資工二甲 數位訊號處理 期末論文報告 指導老師: 黃豐隆 組別: 第六組 組長:N9324750 李岳軒 組員:N9324733 魏早志 N9324725 鍾通芳 摘要 多模式音樂檢索系統是屬於數位典藏服務中的一部分,數位典藏服務是將各種文化典藏數位化,以方便傳播和保存,並且能用自然的方式檢索和搜尋,多模式音樂檢索則是針對數位典藏服務中,音樂部份加以快速搜尋,而在這套多模式音樂檢索系統中,則是著重難度較高的: (1)哼唱比對: 因為每個使用者的音域不同,不可能要求每位使用者都像藝人般,完美的唱出每一個音,所以哼唱比對可以針對不同的音域來做模糊比對,以提高正確性。 (2)敲擊比對: 因為每個使用者敲擊的速度不同,所以必須將使用者輸入的音訊加以分析,並對每個音做適當調整,以提高正確性。 (3)語音比對: 採用隱藏式馬可夫模型,可以達到97%的語音辨識率,方便使用者直接以 語音的方式進行歌名、歌詞、歌者等相關的文字訊息。 研究動機與目的 目前國內外的音樂檢索系統研究並不多,而且大部分都需要輸入較多資訊、語音不自然的停頓、無法接受節奏過快或慢、音調高低不同、資料庫龐大時,搜尋時間過久,為了改善這些缺點,多模式音樂檢索系統也因此誕生了。 應用在數位典藏的方向 多模式音樂檢索系統最早發展於網路KTV點歌系統,因為它自然且人性化的介面,提供使用者在資訊檢索方面有多種模式的輸入,對於數位典藏特別著重以下內容: 1.檢索過程簡單且人性化,使用者可以選擇多種搜尋模式。 2.只要將系統放在網路伺服器上,加上數位典藏的資料庫,就成為一個多模式的數位典藏搜尋引擎,使用者可以使用多種模式輕易在網路上搜尋。 3.應用在作曲分析上,作曲家可以方便的偵測仿冒,或是參考比對其他資料。 設計原理分析 『多模式音樂檢索』乃是國內首見的全新搜尋 方式,不僅僅是一種概念上的創新,更是一種 方法上的重大突破,整個系統大致可以分為四 大部分: 音樂資料庫建構 輸入聲音數位訊號處理程序 搜尋比對程序 平行處理 整體架構如右圖。 聲音數位訊號處理程序: 使用者輸入一連串的聲音,轉變成為與音樂資料庫相同的中界格式,比對的方式可以分為: 聲音取樣過濾 系統以11025Hz為取樣頻率,輸入的聲音以8位元進行量化,並排除能量過低的雜訊。 基頻萃取 將哼唱輸入視為一個帶有固定週期的波型,首先將整個聲波切為數個小音框,每一個小音框包含512點,兩個小音框之間有83點重合,之後針對每個音框經過自相關演算,並將中樣原點附近的訊號濾除以求得每一個小音框的週期,並藉以得到每個音框的頻率,最後累積所有音框的頻率,就可以得到整個輸入聲波的基頻分佈圖。 節奏萃取 敲擊輸入的聲波,取其對應的能量圖,為了計算每個音的拍子長度,對其作音框處理,在對每個音框求出其能量,可以得到局部最大值,接著計算出每個標記間的距離,及可以算出每個敲擊音的時間,以方便資料庫比對。 轉換成中介格式 有了基頻分佈後,可以將過高(大於1043Hz)和過低(82Hz)的頻率濾掉,並經過適當的平滑、刪除錯誤的訊號,降低取樣頻率後,做成時間對半音的作圖,轉換成和音樂資料庫中相同的中介格式,以便比對。 結論: 結束放映 第六組 組長 :李岳軒 組員 :魏早志 鍾通芳 * * 多模式音樂檢索的音樂搜尋引擎,目前包含了11744首音樂資料庫,在辨識率來說目前辨識在前十名的正確率可達87%,為了簡化比對過程,目前以MIDI檔為主,必須哼唱歌曲的開頭,但是也可以從中央開始,並維持一定的辨識率,但是搜尋時間將會延長至六倍之多。不過也將音樂檢索的發展推向更高的領域。

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档