基于HMM模型的音乐哼唱检索系统地研究.pdfVIP

  • 8
  • 0
  • 约1.22万字
  • 约 7页
  • 2017-08-19 发布于安徽
  • 举报

基于HMM模型的音乐哼唱检索系统地研究.pdf

基于HMM模型的音乐哼唱检索系统的研究 袁斌许洁萍 中国人民大学信息学院计算机系,100872 摘要:本文对利用HMM模型进行乐音哼唱检索系统进行了研究。与已有的哼唱检索系统不 同,表文对用户哼唱输八的音高差及音长比进行了统计分析,合成产生了符合用户哼唱输入的 旋律及节奏训练数据库;根据对midi数据库的分析结果,对HMM模型中特征值的选取进行 了新的组合、减雏,对HMM模型训练算法提出了改进,并通过实验验证了HMM模型进行音 乐哼唱检索的有婚I生。在舍有1500个音乐片段的数据库中,27个拴索段的前5位命中率为 85,2%,取得了可喜的结果, 关键词:]hMM模型;哼唱检索;midi数据库 1.引言 “哼唱检索”是基于内容的音乐检索系统(content-basedmusicretrieval)的一个特殊的 应用。目前,在多媒体研究领域,大部分“哼唱检索”是对midi音乐的旋律轮廓信息符号 进行研究,查询和检索都是采用近似字符串比较算法对旋律字符串进行相似比较,典型的 如计算编辑距离的DP法fIj、N.gram算法【zJ,以及利用各种距离测度的匹配算法p1等,取得 了一定的成绩,其检索查询的前5位命中率平均在65%--75%之间p1J。但各算法都存在一定 的问题,如计算编辑距离的DP算法的查询速度太慢、N-gram算法没有考虑各个N.gram在 乐曲中位置的时序性准确率不会很高,而利用距离测度的匹配算法的容错性较差。 隐马尔可夫模型(HMM)是一种对随机现象描述的模型,由于其坚实的数学理论基 础,在模式识别、生物学信息学DNA检索、语音识别等领域都得到了广泛的成功应用。 近年来,HMM也被应用到音乐信息检索领域,JonahShifrin等人14’基于大数据库,对不同 长度的合成输入进行了HMM检索性能的评估,研究结果表明,HMM方法能较好的容忍 遗漏音符和节奏上的哼唱误差。 、在HMM模型中特征值的选取是模型建立的基础。实验中我们建立了100首themes 的midi数据库,统计分析了用户哼唱输入的错误类型,产生了符合用户哼唱错误习惯的训 练序列,根据对数据统计分析的结果,对特征值的选取进行了新的组合、减维,并对HMM 模型训练算法提出了改进,建立了每首歌的一个HMM模型。将27个新的随机检索段作 为观测序列,完成了基于H/vIM模型的音乐哼唱检索系统的研究。 2.HMM模型中特征值的选取 为了确定HMM模型中特征值的选取类型和范围,我们对midi数据库进行了规整处理 并对规整后的数据进行了统计分析。 net 联系作者:许洁萍,E-mailijiepi“gXU@263 128 第一部分第十四届全国多媒体技术学术会议 2.1音高、音长的统计 实验中,我们统计了1000多首歌曲近2万个音符的音高差(每个midi序列中后一个 音符音高减去前一个)。在midi数据库中,一个半音间的音高差为l,+12表示一个高八度 的音符之间的音高差,而12表示为相邻音符问低八度的音高差。图一给出了用spss软件 分析的音高差统计结果。 从圈1中可以看出音高差分布大部分在0、-2、+2上,_7~+7的音符占98%,这 一结果与文献[6】中音乐库的统计结果完成相符。同样,图中也发现±6的差值比±5和±7都 要少,这是因为“三元音”(音符相差6个音高)往往昕起来不和谐悦耳,在音乐中很少 出现。 实验中,我们对音长比(每个midi序列中后一个音符音长比前一个)的分布同样进行 了统计分析(图2所示)。结果表明音长比在对数刻度上的分布大体符合正态分布,并只集 中在有限的离散点上(0.25,1/3,0.5。0.75等)。 I .I.I —l I I一. 图1连续音符间音高差分布 图2连续音符间音长比(求对数)的分布 2.2特征的确定 根据我们所作的统计分析,相邻的两个音符序列出现的情况有:o.25和4:四分音符 和全音

文档评论(0)

1亿VIP精品文档

相关文档