- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
音乐粗情感域中软切割及分类方法
音乐粗情感域中软切割及分类方法
摘 要:针对音乐灯光表演控制系统无法自动获取其控制所需的音乐特征信息,结合传统的ArousalValence模型提出了一种可用于音乐灯光表演的音乐粗情感模型。针对此模型,通过小波分析中的Mallat算法提取比较项并采用强度、节奏比值判断法,对音乐片段进行两次“软切割”,再根据相应的产生式专家系统规则便能够很好地对其进行粗情感域中的分类及特征量提取。仿真结果表明,该方法能够有效地按音乐情感将音乐片段分类,同时能够提取出满足音乐灯光表演控制系统时域上对音乐分段时间节点的高精度要求。
关键词:
音乐特征;音乐情感;情感识别;小波分析;Mallat算法
中图分类号: TP391.4
文献标志码:A
0 引言
常用的声学特征包括频谱能量[1]、美尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)[2]、线性预测倒谱系数[3]、感知线性预测系数[4]及谐波系数[5]等。常用的分类器包括高斯混合模型(Gaussian Mixture Model, GMM)[6]、支持向量机[7]和多层感知器[8]等。但是这些方法仅在基于音频内容的音乐分类、检索与推荐算法的领域发挥着重要的作用。然而,随着日益剧增的大型户外音乐灯光表演系统以及舞台音乐灯光表演系统,迫切需要一种成熟的可应用于表演灯光控制方面的音乐情感识别及特征提取的技术。
基音检测是音乐识别的基础,经常使用的识别方法有即时域法和频域法。时域法[9]根据峰值检测信号周期,但是其抗噪能力差;频域法计算振幅包括快速傅里叶变换(Fast Fourier Transformation,FFT)[10]或小波变换。拉斐尔音乐分割使用隐马尔可夫模型(Hidden Markov models,HMM)[11]提出了一种方法,但计算过程非常复杂。总之,目前国内外还没有一种系统地用于控制方面的音乐识别方法。
由于情感的模糊性[12],很难用传统的逻辑推理方法来处理。本文首先根据基本特征量对整段音乐进行粗情感域划分,然后对于不同粗情感域采用不同的能够表征其情感特征的细节特征量对其进行时间点及其他重要的用于控制方面的信息进行精细提取。
本文着重对其第一步即音乐情感识别粗分类技术进行了详细阐述,结合传统ArousalValence(AV)模型的简化模型,并根据强度、节奏两大基本特征量,通过小波变换中的Mallat算法将一整段音乐进行粗情感域的大致分类,最后根据专家规则分类方法即一定的编号法则对被检音乐进行粗情感域的软切割。
1 粗情感域空间
用于识别情感的空间方法一般是基于情感在几维空间中的定位来实现的。Russell的抑扬模型[13]在情感研究方向上做出了很大的贡献。该模型定义了一个二维的对称结构,即AV(ArousalValence)平面。Thayer[14]认为该情感空间在整合不同情感的方面不仅简单,而且非常实用。也可以把AV(ArousalValence)平面看作是ES(EnergyStress) 平面,即情感力度—紧张度平面。
该情感模型虽然比较简洁,但是相比粗分类所需的模型,该模型还是较为复杂,所以本文将AV情感模型简化为Simplified AV情感模型,简化后的模型如图1所示。
5 结语
本文提出了一种新型的音乐情感识别方法,采用小波变换的Mallat算法,实现了音乐粗情感域中的分类识别。这种基于Mallat算法的方法克服了高低频分辨率不平衡的缺点,并且提高了信号提取的抗扰能力,用简单的两类特征量把分类的准确率提高到80%左右。然而,比较系数的分区普适性不高,还需要进一步通过训练样本集进行精化,以得到普适性较高的分类比较系数节点,从而达到更高的粗分类精确度。
参考文献:
[1]KOS M, GRASIC M, VLAJ D, et al. Online speech/music segmentation for broadcast news domain [C]// IWSSIP09: Proceedings of the 16th International Conference on Systems, Signals and Image Processing. Piscataway: IEEE, 2009: 1-4.
[2]LI Y, WANG D L. Separation of singing voice from music accompaniment for monaural recordings [J].IEEE Transactions on Audio, Speech and Language Proce
您可能关注的文档
最近下载
- 蓝海华腾VA-H系列伺服驱动器 用户手册2.0.pdf
- 国家法定41种传染病大全(就诊科室、传播途径、病原体、检测方法等)及防护措施.doc VIP
- GB50877-2014 防火卷帘、防火门、防火窗施工及收规范.docx VIP
- T_CECWA 2001-2023 钢结构焊接工艺评定标准.docx
- 8.铁路工程预算定额 路基工程宣贯讲义.ppt VIP
- 2024年四川宜宾五粮液股份有限公司招聘笔试真题.docx VIP
- 医疗废物管理条例.pptx VIP
- 2025年辽宁省电力行业十五五发展规划研究.docx
- 国标GB_T 43388-2023《家用汽车产品严重安全性能故障判断指南》实践.pdf VIP
- 厂房租赁合同.doc VIP
文档评论(0)