多声道MIDI音乐检索 - Read.PDF

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多声道MIDI音乐检索 - Read

2006年6月 四川大学学报(自然科学版) Jun 2006 第43卷第3期 JournalofSichuanUniversity(NaturalScienceEdition) Vol.43 N.〕.3 文章编号:0490-6756(2006)03-0538-06 正态分布下基于隐Markov模型的 多声道MIDI音乐检索 徐开阔,唐常杰,段磊,魏大刚,钟义啸,乔少杰 (四川大学计算机学院,成都610065) 摘要:音乐查询是信息检索领域的一个研究热点.分析了现有方法应用范围局限性和低效率的 原因,讨论了用户哼唱和多声道MIDI特征序列的表达方法,提出新的基于内容的多声道MI- DI检索模型HMRM(HomophonicMIDIRetrievalModel).新模型将多声道音乐表达成一个隐 Markov模型,计算哼唱对象与库中对象的相似度并排序返回查询结果.实验表明,对于不同哼 唱水平的用户,HMRM的识别率平均能达到73.3%,具有较高的查准率. 关键词:信息检索;多声道音乐;基于内容的检索 中图分类号:TP391.3 文献标识码:A 1 引言 音乐检是目前信息检索领域中的一个特殊热点.其中,基于内容的音乐检索有着特殊优势[[I].与传统 的按名称检索不同,基于音乐内容的检索将用户哼唱、钢琴演奏等作为输人,系统根据用户的条件检索数 字音乐库,最后按照某种标准返回用户要查询的乐曲. 关于将用户哼唱转化为数字格式的方法在文2【]中已作讨论.我们的工作主要集中在数字化音乐检索 过程的研究.早期音乐检索研究工作主要集中在单一单查询检索和多一多查询检索两个方面,单一单查询输人 用户的哼唱,对单声道数字音乐库进行检索,易于研究.绝大多数音乐是多声道的.因而单声道检索技术的 实用性不强;多一多查询输人用户弹奏之类的多声道旋律,对多声道数字音乐库中进行检索.但大多数用户 不会弹奏乐器或不具备相关的乐器,因而很难将取得的研究成果向普通用户推广.针对单~单查询检索和 多一多查询检索的不足,我们提出一种在正态分布下基于隐Markov模型对多声道MIDI进行检索的模型 HMRM(HomophonicMIDIRetrievalModel).该方法以用户哼唱作为输人,查询多声道数字音乐库.实验 表明,HMRM具有较高的查准率,针对不同的用户,其查准率平均达到73.3%. 2 相关工作 根据查询条件和声道数量,音乐检索可分为3大类:单一单查询、多一多查询和单一多查询. 单一单查询理论比较成熟,方法较多,且查准率都相对较高,能够达到85%左右,文[3]基于动态规划 方法,使用相对音高RP(RelativePitch)和音高开始时间间隔IOI(Inter-Onset-Interval)及其变形来表达哼 唱或音乐,然后比较特征序列的相似度.该方法的缺点是过多地依赖于参数值的选取和用户查询的质 量[3].文4【〕使用了一种基于相关系数的检索方法,该方法的特征序列在文 3【」的基础上又增加了音高持 续时间,然后使用相关系数来衡量特征序列的相似性.该方法的缺点是部分假目标的相似度得分很高[43 文5【」使用了一种基于时间序列的方法,该方法将音乐表达成时间序列,然后计算时间序列间的距离.该方 收稿 日期:2005-09-25 基金项 目:国家自然科学基金 ;高等学校博士学科点专项科研基金SRFDP20020610007) 作者简介:徐开阔(1983一),男,2005级硕士研究生,研究方向为数据库与知识工程 关通讯作者 第 3期 徐开阔等:正态分布下基于隐Markov模型的多声道MIDI音乐检索 539 法的缺点是过多的依赖于它的连续性和线形特征[[61.文6【〕使用隐Markov模型和同音模型实现了多一多查 询检索,通过各种乐理上的假设来获取参数,该方法只适合于检索部分类型的音乐{(61.文7〔〕使用了一种 基于隐Markov模型的方法,该方法总体框架和我们所用方法类似,将二元组(RP,IOI)看作是隐状态,通 过训练集得到发射矩阵(emissionmatrix).该方法的缺点是查询结果的精度依赖于训练集的选择[

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档