基于支持向量机音乐情感分类.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于支持向量机音乐情感分类

基于支持向量机音乐情感分类   摘 要:如今数字化信息对人们的生活产生了巨大的影响,对于爱好音乐的人们来说大量的歌曲信息如果进行有效的分类,如何对这些音乐进行分类,从而进行有效的信息检索是信息处理领域的研究热点。通过对音乐的乐理知识的深入分析,能够有效的提取出反应音乐情感的特征向量,运用支持向量机(SVM)实现了对音乐的情感分类。实验结果表明,所运用的分类方法准确有效。   关键词:支持向量机;MIDI文件;音乐情感分类   中图分类号:TP391.4 文献标识码:A   1 引言(Introduction)   音乐作为大众娱乐主要方式之一,不仅为大众提供美妙的听觉享受,同时其本身也具有丰富的情感内涵,具有很强的情感调节功能,满足听众的情感需求。目前很多大型音乐网站都需要高效的检索和推荐功能,而音乐情感则是音乐检索与推荐工作的重要依据之一。目前音乐的感情多数是根据听众或者专家对于音乐的评价作为感情标签,其工作量相当大,而且不同认知水平的人对于同一段音乐有不同的评价。随着计算机与人工智能技术的发展,音乐感情的自动识别成为国内外学者研究的热点问题之一。   现有的音乐情感研究模型,可分为基于文本关键词模型和基于音频参数模型两种。David Torres等人[1]根据乐曲的歌词信息,识别乐曲的情感类型。Yuan-Yuan shi等人[2]通过构建一个调制频谱分析系统,从压缩的音乐文件中提取节奏信息,通过分析音乐节奏的变化实现对音乐感情的分类。M.wang等人[3]通过提取音乐的频谱信息,利用支持向量机实现对于音乐情感的分类。Cyril Laurier和Perfeto Herrera等人利用音乐波形文件的频谱特征,利用支持向量机实现音乐的情感分类。   本文从乐谱创作的角度出发,以音乐网站音乐推荐系统对于音乐情感需求为背景,提出通过对音乐的MIDI文件解析得到音乐的感情特征组成六维感情特征向量,利用支持向量机(SVM)实现对音乐表达的情感进行具体分类。   2 Thayer情感模型(Thayer emotion model)   目前,对于音乐情感分类所采用的模型主要包括Thayer情感模型、威廉.冯特情感模型、Hevner情感模型、Russell情感模型和Plutchik情感模型等,其中Thayer情感模型是二?S情感模型[4]纵坐标表示的是能量维度,从“平静的”到“活力的”变化,反映的是主体的情感活跃程度,横坐标表示的是压力维度,从“消极”到“积极”的变化,反映了主体的主观感受,从而将音乐情感划分为具有代表性的四类:兴奋的、愤怒的、悲伤的和放松的。如图1所示为Thayer情感模型采用的能量维度和压力维度与乐理理论所对应的情感表达方式具有较好的对应关系,因此本文将采用Thayer情感模型,利用支持向量机将乐曲的表达情感分为四类。   MIDI文件是音乐文件的一种存储形式,它以字节的形式对乐曲进行描述,使用数字编码描述乐谱的基本特征[4]。多数MIDI文件都是多音轨文件,其中的主旋律和伴奏旋律都分布在不同的音轨上,通常将主旋律所在的音轨称之为主音轨,其包含了音乐的主要情感信息。因此通过分析主音轨的情感就可以识别出该段音乐所表达的感情。目前比较成熟的主旋律提取方法是根据信息熵理论定义音轨特征的熵值,然后由MIDI文件的音轨信息熵和其他重要特征组成特征向量构建随机森林分类器,进而提取MIDI文件的主旋律。实验证明,该方法的正确率达到93%以上。   音乐是音符的有机组合,其不同的组合形式不同的旋律,表达不同的情感。每个音符都有自身的音高、音长和音强等信息,但每首音乐并不是由单个的音符所表达,而是通过不同的音符之间的组合表达旋律,抒发感情。因此音乐的旋律、节奏也是感情表达的重要方面。因此,本文通过对MIDI文件的解析,可以得到的基本数据信息包括音高、音长、音强和节拍等信息,本文分别定义为、、和。   音乐是由不同的音符组合在一起,其组合规律形成自身的特点,表达着各种感情。包括音程、旋律、节奏等高层次的音乐特征。因此本文定义如下表达音乐情感的向量空间。   音高:音高是音乐的基本要素之一,其高低及其变化是音乐内容和感情的表达的重要方式。本文分别定义音高均值和音高方差表示乐曲的音高水平和音高变化:   音高均值定义为:   (1)   其中,n表示乐段音符的个数,表示音符的音高。   音高变化定义为:   (2)   音强:音乐的强度是音乐表达感情的重要方式之一。通过音强的变化可以进一步加强和丰富音乐的情感。本文用音强均值和音强方差来衡量音乐的音强及音强变化:   音强均值定义为:   (3)   音强变化定义为:   (4)   旋律:旋律是由连续音符以特定的顺序组织起来形成的,它是音乐情感

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档