网站大量收购独家精品文档,联系QQ:2885784924

基于不同距离测度音乐结构分析研究.pdfVIP

基于不同距离测度音乐结构分析研究.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于不同距离测度的音乐结构分析研究 赵阳 周燕红许洁萍 中国人民大学信息学院计算机系,北京,100872 摘要:基于听觉感知的音乐结构的分析,是在模拟人的听觉感知结果的基础上对音乐重复模 式的探测和发现,其研究结果对基于内容的音频信息检索领域的研究和应用都有重要的意义。 选择正确的反映人的听觉感知的距离测度是音乐结构分析中的重要研究内容之一。本文选取 CQT特征参数,对欧氏距离、余弦距离和结构距离三种相似度量方法进行了较为深入的实验 分析;利用三种距离测度,对10首具有重复模式的歌曲(包含有流行乐曲,儿歌,民族歌曲) 进行了结构标注,取得了81.6%的精确度和83%的FI.measure综合评估结果。标注结果表明: 反映音符间听觉感知相似的结构距离,在音乐旋律相似上还存在一定的问题。 关键词:音乐结构;感知分析;重复模型 1.引言 重复几乎出现在所有的音乐中,在音乐的构成中起到很大作用。人们在听完一首乐曲, 往往能够记住其中重复出现的乐段,虽然说为什么这种重复的乐段能够引起人们的特别注 意的原因有很多种看法,但是比较一致的意见是音乐的重复段中往往包含整首乐曲的主题 思想和表达的动机,而且较长的重复段落本身就代表着全曲的演奏模式,包括节奏、调式 等,加之重复出现,因而能够特别刺激人们的记忆。所以,对于音乐的重复模式和结构的 探测对于音乐分析中的音乐摘录、音乐主题提取和音乐检索都很有帮助…。 一般情况下音乐结构分析的主要步骤包括: ·选取特征,提取示例音乐的特征向量序列V:1,1v2一h;将n帧特征向量分隔成 为固定长度的有重叠的m个子片段(segments):s1S2..S。(Jf=%Vk/+1..阱l。一1)。 v斛1. 向量串v舡v舫+1..h做匹配。 J。 ·结构标注:包括重复点探测及片段合并;并采取不同的聚类方法进行片段标注【7 乐听觉感知中会起到很大的作用;同时,我们对不同的距离测度在听觉感知分析中存在的 问题进行了分析研究,根据研究结果,对9首中国流行音乐进行了结果分析。文章中,第 二部分我们给出了特征定义,第三部分介绍了三种常用距离并对它们进行了理论上的比较, 同时用实验验证我们的想法。第四部分则用实验对几首音乐基于不同的距离测度方法进行 了结构分析和重复模式发现,并对实验结果进行了简单的评价。 资助项目:国家自然科学基金委员会资助项目 联系作者:许洁萍,Emaih xjieping@ruc.edu.cn 82 第一部分第16届全国多媒体技术学术会议 2.特征选择 人们对音乐重复结构的感知基本上是基于旋律的相似,也就是音符的音高和音符序列 的包络。传统的一些音乐特征如Mel-FrequencyCepstral 音色的信息,不能准确地反映音高。为了提取能够准确反映音高信息的音乐特征,文献[8] 中提出了常Q变换(CQT)的方法。我们的实验中采取了使用这种方法提取的CQT特征值。 在CQT中,通过使用中心频率呈几何分布的滤波器组来提取能表示特定音符的频谱 序列。在我们的实验中,音符分布在3个八度(octave)上,也就是提取了36个半音。 ,虬一1—-j2—xQn Nk x(七)=i1∑x(n)e 』V^n=0 其中,x(k)代表中一tl,频率为兀的第k个音的频谱能量。 k, 以=fo·276,k=0,1,2,…,36 .厶代表我们计算中音符的最低频率。我们选为130.8Hz,也就是C3的频率。这是因为 绝大多数实验中涉及的音乐的频率都在这一频率之上。

文档评论(0)

july77 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档