基于HMM模型的音乐哼唱检索系统地研究.pdfVIP

下载本文档

8
0
约1.22万字
约 7页
2017-08-19 发布于安徽
举报

基于HMM模型的音乐哼唱检索系统地研究.pdf

基于HMM模型的音乐哼唱检索系统的研究袁斌许洁萍中国人民大学信息学院计算机系，100872 摘要：本文对利用HMM模型进行乐音哼唱检索系统进行了研究。与已有的哼唱检索系统不同，表文对用户哼唱输八的音高差及音长比进行了统计分析，合成产生了符合用户哼唱输入的旋律及节奏训练数据库；根据对midi数据库的分析结果，对HMM模型中特征值的选取进行了新的组合、减雏，对HMM模型训练算法提出了改进，并通过实验验证了HMM模型进行音乐哼唱检索的有婚I生。在舍有1500个音乐片段的数据库中，27个拴索段的前5位命中率为 85，2％，取得了可喜的结果，关键词：]hMM模型；哼唱检索；midi数据库 1．引言 “哼唱检索”是基于内容的音乐检索系统(content-basedmusicretrieval)的一个特殊的应用。目前，在多媒体研究领域，大部分“哼唱检索”是对midi音乐的旋律轮廓信息符号进行研究，查询和检索都是采用近似字符串比较算法对旋律字符串进行相似比较，典型的如计算编辑距离的DP法fIj、N．gram算法【zJ，以及利用各种距离测度的匹配算法p1等，取得了一定的成绩，其检索查询的前5位命中率平均在65％--75％之间p1J。但各算法都存在一定的问题，如计算编辑距离的DP算法的查询速度太慢、N-gram算法没有考虑各个N．gram在乐曲中位置的时序性准确率不会很高，而利用距离测度的匹配算法的容错性较差。隐马尔可夫模型(HMM)是一种对随机现象描述的模型，由于其坚实的数学理论基础，在模式识别、生物学信息学DNA检索、语音识别等领域都得到了广泛的成功应用。近年来，HMM也被应用到音乐信息检索领域，JonahShifrin等人14’基于大数据库，对不同长度的合成输入进行了HMM检索性能的评估，研究结果表明，HMM方法能较好的容忍遗漏音符和节奏上的哼唱误差。、在HMM模型中特征值的选取是模型建立的基础。实验中我们建立了100首themes 的midi数据库，统计分析了用户哼唱输入的错误类型，产生了符合用户哼唱错误习惯的训练序列，根据对数据统计分析的结果，对特征值的选取进行了新的组合、减维，并对HMM 模型训练算法提出了改进，建立了每首歌的一个HMM模型。将27个新的随机检索段作为观测序列，完成了基于H／vIM模型的音乐哼唱检索系统的研究。 2．HMM模型中特征值的选取为了确定HMM模型中特征值的选取类型和范围，我们对midi数据库进行了规整处理并对规整后的数据进行了统计分析。 net 联系作者：许洁萍，E-mailijiepi“gXU@263 128 第一部分第十四届全国多媒体技术学术会议 2．1音高、音长的统计实验中，我们统计了1000多首歌曲近2万个音符的音高差(每个midi序列中后一个音符音高减去前一个)。在midi数据库中，一个半音间的音高差为l，+12表示一个高八度的音符之间的音高差，而12表示为相邻音符问低八度的音高差。图一给出了用spss软件分析的音高差统计结果。从圈1中可以看出音高差分布大部分在0、-2、+2上，_7～+7的音符占98％，这一结果与文献[6】中音乐库的统计结果完成相符。同样，图中也发现±6的差值比±5和±7都要少，这是因为“三元音”(音符相差6个音高)往往昕起来不和谐悦耳，在音乐中很少出现。实验中，我们对音长比(每个midi序列中后一个音符音长比前一个)的分布同样进行了统计分析(图2所示)。结果表明音长比在对数刻度上的分布大体符合正态分布，并只集中在有限的离散点上(0．25，1／3，0．5。0．75等)。 I ．I．I —l I I一．图1连续音符间音高差分布图2连续音符间音长比(求对数)的分布 2．2特征的确定根据我们所作的统计分析，相邻的两个音符序列出现的情况有：o．25和4：四分音符和全音

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于HMM模型的音乐哼唱检索系统地研究.pdfVIP