基于谱包络非负矩阵分解的钢琴多音符估计算法.pdfVIP

基于谱包络非负矩阵分解的钢琴多音符估计算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
音频声学 基于谱包络非负矩阵分解的钢琴多音符估计算法 万玉龙,王宪亮,周若华,颜永红 中国科学院声学研究所语言声学与内容理解重点实验室 摘要:提出了一种基于能量谱包络非负矩阵分解的钢琴多音符估计算法。首先对钢琴88 个单音片段进行RTFI时频分析,求得对应平均能量谱,经过时序平均、归一化求得平均能 量谱包络,拼接成钢琴的单音能量谱包络基矩阵。之后对测试的多音片段,采用同样处理方 法求得多音平均能量谱包络,通过非负矩阵分解求得各音符的权重系数,最后通过阈值限定 求得多音符估计结果。性能评估实验基于MAPS数据集的UCHO集和RAND集展开,与 MIREX中最好的钢琴音乐自动记谱系统相比,本文提出的钢琴多音符估计算法性能有很大幅 度的提升。 关键词:自动音乐记谱多基频估计钢琴音乐非负矩阵分解 ●o_‘‘oo●一 1 刖菁 Music 自动音乐记谱(Automatic 将音乐声学信号“理解’’为音乐符号形式,使计算机具备“听音记谱”的能力。 在音乐信号处理和分析领域中,AMT都是非常关键的技术之一,能极大方便音乐 内容分析和注释,被广泛应用于音乐节拍识别、音乐信息检索及计算机音乐辅助 教学等应用。 AMT核心任务主要包括两个:音符起始点检测和基频估计。根据同一时刻包 含的音符个数,基频估计可以分为单基频估计和多基频估计两种,其中单基频估 计算法已经相对成熟;由于多音音乐的谐波结构相对复杂,容易造成频谱重叠等 现象,因此,多基频估计一直是难度很高且亟待解决的问题。 自2007年起,在国际音乐信息检索评测(MIREX)中出现了很多种钢琴音乐 的多基频估计算法,主要分为三大类:基于特征分析的【1]、基于统计模型的和基 于矩阵分解的。其中最好的钢琴AMT系统采用的是基于特征分析的多基频估计 算法。 本文提出了一种针对钢琴音乐的多基频估计算法。算法流程图如图1所示 图1算法流程图 ..283.. 中国科学院声学研究所纪念建所50周年暨第五届学术交流会 首先将钢琴88个单音片段进行单独处理,求得各自平均能量谱,之后求得平 均能量谱包络,进行包络归一化后拼接形成能量谱包络基矩阵,对于每个多音片 段,采用同样处理方法,求得多音平均能量谱包络,进行非负矩阵分解,求得88 个音符的能量权重系数,最后进行阈值限定,求得多音符的估计结果。 本文分为以下几个部分:第2节介绍平均能量谱包络的求解;第3节介绍钢 琴音符能量权重系数的求解;第4节介绍性能评估实验和结果;第5节是全文的 总结。 2平均能量谱包络 2.1预处理 为保证算法通用性,首先对钢琴音乐信号x【n】进行规整处理,分别采用公式 (1)和公式(2)进行直流分量去除和波形振幅规整。 x[n】-Ⅱ刀卜去∑勘】 (1) 对以1_—盟 (2) ~maxfx[n】I 这里,N代表输入信号中的样点个数。 2.2回声器时频分析 在对钢琴音乐进行时频分析时,本文选用Zhou在文献【2】中提出的回声器时 频分析(Resonator Time—FrequencyImage,RTFI)方法,计算公式如下式(3)所 示: (3) RTFI(t,缈)=x(f)幸,R(f,co)=r(∞)lx(r)e岫如叫P和p。’df 这里,,。代表一阶复数回声滤波器在频率力处的冲激响应,积分号前的r(国) 用于对频率响应进行规整,同时它也决定了指数窗的窗长和时间分辨率。实际应 用中,使用一阶数字滤波器来实

文档评论(0)

whl005 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档