- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HMM模型的音乐哼唱检索系统的研究
袁斌许洁萍
中国人民大学信息学院计算机系,100872
摘要:本文对利用HMM模型进行乐音哼唱检索系统进行了研究。与已有的哼唱检索系统不
同,表文对用户哼唱输八的音高差及音长比进行了统计分析,合成产生了符合用户哼唱输入的
旋律及节奏训练数据库;根据对midi数据库的分析结果,对HMM模型中特征值的选取进行
了新的组合、减雏,对HMM模型训练算法提出了改进,并通过实验验证了HMM模型进行音
乐哼唱检索的有婚I生。在舍有1500个音乐片段的数据库中,27个拴索段的前5位命中率为
85,2%,取得了可喜的结果,
关键词:]hMM模型;哼唱检索;midi数据库
1.引言
“哼唱检索”是基于内容的音乐检索系统(content-basedmusicretrieval)的一个特殊的
应用。目前,在多媒体研究领域,大部分“哼唱检索”是对midi音乐的旋律轮廓信息符号
进行研究,查询和检索都是采用近似字符串比较算法对旋律字符串进行相似比较,典型的
如计算编辑距离的DP法fIj、N.gram算法【zJ,以及利用各种距离测度的匹配算法p1等,取得
了一定的成绩,其检索查询的前5位命中率平均在65%--75%之间p1J。但各算法都存在一定
的问题,如计算编辑距离的DP算法的查询速度太慢、N-gram算法没有考虑各个N.gram在
乐曲中位置的时序性准确率不会很高,而利用距离测度的匹配算法的容错性较差。
隐马尔可夫模型(HMM)是一种对随机现象描述的模型,由于其坚实的数学理论基
础,在模式识别、生物学信息学DNA检索、语音识别等领域都得到了广泛的成功应用。
近年来,HMM也被应用到音乐信息检索领域,JonahShifrin等人14’基于大数据库,对不同
长度的合成输入进行了HMM检索性能的评估,研究结果表明,HMM方法能较好的容忍
遗漏音符和节奏上的哼唱误差。
、在HMM模型中特征值的选取是模型建立的基础。实验中我们建立了100首themes
的midi数据库,统计分析了用户哼唱输入的错误类型,产生了符合用户哼唱错误习惯的训
练序列,根据对数据统计分析的结果,对特征值的选取进行了新的组合、减维,并对HMM
模型训练算法提出了改进,建立了每首歌的一个HMM模型。将27个新的随机检索段作
为观测序列,完成了基于H/vIM模型的音乐哼唱检索系统的研究。
2.HMM模型中特征值的选取
为了确定HMM模型中特征值的选取类型和范围,我们对midi数据库进行了规整处理
并对规整后的数据进行了统计分析。
net
联系作者:许洁萍,E-mailijiepi“gXU@263
128 第一部分第十四届全国多媒体技术学术会议
2.1音高、音长的统计
实验中,我们统计了1000多首歌曲近2万个音符的音高差(每个midi序列中后一个
音符音高减去前一个)。在midi数据库中,一个半音间的音高差为l,+12表示一个高八度
的音符之间的音高差,而12表示为相邻音符问低八度的音高差。图一给出了用spss软件
分析的音高差统计结果。
从圈1中可以看出音高差分布大部分在0、-2、+2上,_7~+7的音符占98%,这
一结果与文献[6】中音乐库的统计结果完成相符。同样,图中也发现±6的差值比±5和±7都
要少,这是因为“三元音”(音符相差6个音高)往往昕起来不和谐悦耳,在音乐中很少
出现。
实验中,我们对音长比(每个midi序列中后一个音符音长比前一个)的分布同样进行
了统计分析(图2所示)。结果表明音长比在对数刻度上的分布大体符合正态分布,并只集
中在有限的离散点上(0.25,1/3,0.5。0.75等)。
I
.I.I —l I
I一.
图1连续音符间音高差分布 图2连续音符间音长比(求对数)的分布
2.2特征的确定
根据我们所作的统计分析,相邻的两个音符序列出现的情况有:o.25和4:四分音符
和全音
您可能关注的文档
最近下载
- 危重症患者护理文书书写规范PPT参考课件.ppt VIP
- 2025版新教材高中语文第一单元第2课立在地球边上放号红烛峨日朵雪峰之侧致云雀教案新人教版必修上册.docx VIP
- 经史子集国学文库:集部·小说·唐钟馗全传.pdf
- 采购部年度总结及次年工作计划 .ppt VIP
- AI大模型在军事领域中的应用与军事智能化.pptx VIP
- 现场应急处置卡(34类常见事故).doc VIP
- 容积粘度吞咽测试(VVST)吞咽障碍的临床检测方法课件.ppt VIP
- CLSI-EP09-A3-2013中文翻译文档.pdf VIP
- 中医食疗学教案--------(06年春).doc VIP
- 图形显示装置使用说明书-北大青鸟.pdf VIP
文档评论(0)