网站大量收购独家精品文档,联系QQ:2885784924

基于卷积神经网络的声学场景分类算法研究.pdf

基于卷积神经网络的声学场景分类算法研究.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 26 卷 ,第 2 期 中国传媒大学学报 (自然科学版) Vol 26 ,No 2 20 19 年 4 月 JOURNAL OF COMMUNICATION UNIVERSITY OF CHINA (SCIENCE AND TECHNOLOGY ) Apr ,20 19 基于卷积神经网络的声学场景分类算法研究 赵薇ꎬ黄敬雯ꎬ靳聪ꎬ徐陈缘 (中国传媒大学 信息与通信工程学院ꎬ北京 100024) 摘要:声学场景中包含着很多长时特征和短时特征ꎮ 本文提取环境声的能量信息ꎬ批量生成声音场景的三维语谱 图ꎬ作为卷积神经网络的输入ꎮ 神经网络采用卷积层和下采样层重复交叠ꎬ整体网络采用六层网络结构ꎬ最终经过 softmax方法进行多分类ꎮ 实验采用DCASE2017 竞赛数据集作为素材ꎬ对15 类6300段音频进行训练测试ꎬ结果表 明ꎬ语谱图特征与卷积神经网络相结合的算法能够很好的提取长时特征和短时特征ꎬ使得最终分类准确率较高ꎬ优 于网站基线系统的分类结果ꎮ 关键词:声学场景ꎻ语谱图ꎻ卷积神经网络 中图分类号:TP273+.21  文献标识码:A  文章编号:1673-4793(2019)02-0024-07 Research on Acoustic Scene Classification Algorithm Based on Convolutional Neural Network ZHAO WeiꎬHUANGJing ̄wen (School of Information and Communication EngineeringꎬCommunication University of ChinaꎬBeijing 100024ꎬChina) Abstract:The extraction of soundfeaturesisanimportantpart of sound scenerecognition. Inthispaperꎬ the energy information of the extracted sound istransformed into a massspectrum map asthe input of the convolutional neural network by generating the three-dimensional spectrogram of the sound scene. The acoustic features are deeply extracted and analyzedꎬand finally classified by softmax layer. The experi ̄ mental resultsshow that the convolutional neural networkhasbetter performancefor imagefeature extrac ̄ tion thanother deep networks. The spectralfeaturesof soundarecombinedwith convolutional neural net ̄ works. The ability to extract long-termfeaturescan also extract short-termfeaturesꎬresulting in higher final classification accuracy. Key words:Acoustic sceneꎻfeature extractionꎻconvolutional neural network 和利用的关键技术之一ꎮ 音频分类是提取音频结构 1  引言 和内容语义的重要手段ꎬ基于内容的音频、视频检索

文档评论(0)

134****4182 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档