基于音频指纹和版本识别的音乐检索技术研究-计算机科学与技术专业论文.docxVIP

基于音频指纹和版本识别的音乐检索技术研究-计算机科学与技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 Classified Index: TP391.42 U.D.C: 681.3 Dissertation for the Master Degree in Engineering THE MUSIC RETRIEVAL TECHNOLOGY BASED ON AUDIO FINGERPRINT AND VERSION IDENTIFEICATION Candidate: Guo Yongshuai Supervisor: Associate Prof. Zheng Guibin Academic Degree Applied for: Master of Engineering Speciality: Computer Science and Technology Date of Defence: June, 2014 Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学工学硕士学位论文 哈尔滨工业大学工学硕士学位论文 摘 要 基于内容的音乐检索是当前音频检索的热门领域,而且随着在线音乐量的 不断增加,其应用价值也越来越大。另一方面,用户的检索需求也在变化,他 们往往不满足于仅仅获得与查询完全相同的歌曲,还希望获得目标音乐的多个 版本,比如不同歌手、不同场合演唱的版本。随着网络自媒体的发展和业余翻 唱的普及,这种需求也越来越明显。 基于内容的音乐检索分别从查询音乐和样例音乐提取特征,然后进行特征 匹配来检索与查询相同的样例音乐。在样例检索中使用的特征通常称为音频指 纹,其追求格式紧凑简洁,倾向于匹配内容相同的音乐片段,而音乐版本特征 表达复杂,倾向于匹配版本特征相同的片段,而内容并不一定相同。因此本文 对两者分开处理,音乐版本识别可以在规范样例库中离线进行,而基于音频指 纹的检索实时进行,对于指纹检索命中样例,可以根据版本识别结果马上给出 相关样例(即该歌曲的其它版本)。 由于人类听觉性能良好,本文希望从基于听觉机理的特征出发来构建音频 指纹。在分析人耳的生理特征后,本文使用余弦基和发放函数来仿真耳蜗对声 音的处理流程,然后使用稀疏分解得到特征系数。为了克服分解耗时较高的问 题,提出了基于匹配追踪算法的快速特征提取方法。 由于基于听觉机理的稀疏特征形式复杂,并不适于直接用来检索,本文将 其压缩转换为音频指纹。应用的主要方法包括使用最小哈希对高维二值序列特 征进行降维,以及使用局部敏感哈希进行快速检索,然后给出相应的候选确认 和样例检出方法。实验表明该指纹特征具有较好的检索效率和表达性,对于轻 微噪声和时域全局性变化的鲁棒性较好,但对时域局部变化鲁棒性较差。 在音乐版本识别方面,本文首先分析了音乐版本领域内的基础定义、主要 问题和通用处理方法。通过对识别流程梳理和各种方法比较分析,构建出完整 的音乐版本识别方法。本文对常用的谐波音级轮廓特征进行了改进,加入节拍 和调移信息并作为版本识别的核心特征,而且在特征计算前应用了必要的预处 理步骤,包括峰值估计、节拍估计和参照频率估计等。实验结果显示本文构建 的版本识别方法是有效的。 关键词:音频指纹;版本;稀疏分解;局部敏感哈希;谐波音级轮廓特征 I Abstract Content-based music retrieval is one hot area of music retrieval. The significant increase of online music has enhanced its value of application. On the other hand, users’ retrieval demand are also in the change, they are never satisfied with just get the same song as query, but also want to get multiple versions of music, such as different singers sung the song at different occasions.With the development of the we-media and the popularity of amateur cover, this demand is becoming more and more obvious. Content-based music retrieval system will extract feature from the query music and sample music respectively,

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档