基于声学特征乐器研究.docVIP

下载本文档

17
0
约3.83千字
约 8页
2018-08-29 发布于福建
举报
版权申诉

基于声学特征乐器研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于声学特征乐器研究

基于声学特征乐器研究　　【摘要】论文基于声学特征的乐器研究，将从乐器的基础知识入手，结合特征抽取研究，对乐器音频信号的声学特征展开论述。最后，提出乐器分类的具体方法。希望此研究能为音频与音乐信号研究分析提供参考性建议。　　【Abstract】The research of musical instruments based on acoustic characteristics will begin with the basic knowledge of musical instruments. And combining with the research of feature extraction， this paper discusses the acoustic characteristics of musical instruments audio signals. Finally， the concrete method of musical instrument classification is put forward. It is hoped that this study can provide reference for the research and analysis of audio and music signals. 　　【关键词】声学特征；乐器识别；乐器分类；倒谱参数　　【Keywords】acoustic characteristics； musical instrument recognition； musical instrument classification； cepstrum parameters 　　【中图分类号】O14 【文献标志码】A 【文章编号】1673-1069（2017）10-0120-02 　　1 引言　　乐器，是指可以用不同方法奏出声音的工具，在主要研究的西方乐器中，按照声学特征分类，可将其分为木管乐器、弦乐器和铜管乐器。同类的乐器在音色上是类似的，人的听觉系统不好进行区分，如长号和圆号。在机器识别中，也会面临这样的问题。基于此，本文针对声学特征的乐器识别领域展开研究。　　2 乐器的基础知识　　乐器会产生整数倍频率的声波，此频率为泛音。其中，与乐器音色相关的参数是基频。除基频以外，谐波部分的比例决定着音色，不同乐器的识别度来源于音色。比如，同样频率的声音，强度相同，由于不同的音色，人的听觉系统能够分辨出声音来自何种乐器。乐器的音频是对声音进行数字化处理后的结果，可分为物理样本层、最高语义层、声学特征层。其中，声学特征层是乐器研究的关键层。另外，音频的常用格式包括Wav格式、MIDI格式、MP3格式等。　　3 特征抽取研究　　对于不同音乐片段，或者不同乐器独奏表演，基于不同声学特征进行识别，其识别结果不同。为了能够在识别乐器时表现出突出特征，必须以找到良好声学特征作为前提。因此，加强对声学特征的乐器研究具有重要意义[1]。抽取的特征可分为五大类，其中，时域特征是将乐器音频作为整体计算，能量特征包括和声、噪声等能量。波谱特征是基于信号的傅里叶变换特征，和声特征是基于信号声模式的计算特征，感知特征是利用人类听觉过程模型进行计算的特征。　　4 乐器音频信号的声学特征　　4.1倒谱系数　　在倒谱系数中，共振峰是音质的决定性因素，也是语音识别的必要信息，处于声音频谱中能量较为集中的区域，能够充分反应声道物理特征[2]。倒谱系数就是共振峰的表现形式，其定义为：c（n）=F-1{log {F[y（n）]}}。其中，F代表离散傅里叶变换，结合同态处理方法，针对语音信?进行变换，以此提高特征参数稳定性。但是，倒谱系数由于计算效率低，在实际的乐器识别中应用很少。　　4.2 MFCC系数　　基于人耳听觉特征，Mel频率被提出。而MFCC就是利用Mel频率与赫兹频率的非线性对应关系，得到的频谱特征。目前，该系数已经广泛应用在语音的识别领域中。但是由于两个频率之间的对应关系，导致该系数计算精度下降。因此，在实际的应用中，只使用低频MFCC[3]。MFCC系数的提取，首先是经过预滤波，然后经过模数变换进行预加重，再经过分帧和分窗进行傅里叶变换等。　　4.3 线性预测倒谱参数　　线性预测分析，是基于声道短管级联模型，根据系统传递相关函数形式，对信号线性组合进行估计的过程。其倒谱参数能够反应声道的响应，几十个倒谱系数，就能够具有较明显的共振峰特性，适应于语音识别，在乐器识别中也得到了应用[4]。线性预测的计算方法有很多，包括格型法、自相关法等，其提取包括两个重要过程，一是求解线性预测LCP，根据LCP分析阶数，求解线性预测系数。