多媒体网络中钢琴音乐音符切分高效识别方法研究.docxVIP

下载本文档

6
0
约7.82千字
约 8页
2018-02-06 发布于湖北
举报
版权申诉

多媒体网络中钢琴音乐音符切分高效识别方法研究.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

多媒体网络中钢琴音乐音符切分高效识别方法研究

多媒体网络中钢琴音乐音符切分高效识别方法研究摘要：目前，有关于钢琴的音乐音符切分识别方面依然处于起步阶段，特别是在计算机的乐谱录入识别方面经常会出现识别错误或者是无法识别的问题。为了更好的实现钢琴音乐音符切分识别的精确度，本文提出采用局部能量的端点检测、多样本字典、多样本字典后处理等方法来进行音符切分的高效识别。利用这一方法使音符切分识别的准确度提高了8%，为进一步实现钢琴音乐音符的高效识别与计算机的乐谱精确录入奠定了基础。关键词：多媒体网络；钢琴音乐；音符切分；识别1 引言多媒体网络的乐谱识别跟踪思想自上世界70年诞生，开始了利用计算机进行辅助音乐创作的方式。由此开始，计算机在音乐鉴赏领域，特别是辅助教学以及乐谱自动记录等方面都有着较好的应用，于是这一话题也逐渐的成为国内外学者重点研究分析的课题之一。在有关于多媒体网络的钢琴音乐音符切分识别的研究中，最早是由Moore提出的，其开始将音符切分识别进行系统化设计，奠定了整个音符识别的模型研究基础，但是在其研究中所允许的最大发音音符数为2，所以无法进行实际的应用[1]。在19世纪80年代初，斯坦福大学研究小组对Moore的模型进行完善，提高了识别准确的，但是依然停留在同时识别量为2个音符的模式下[2]。在进入了80年代的后期，日本学者开始了对音乐信号的感觉信息的分析与研究，并在这一过程中建立了模仿人耳的音乐感觉机器管理系统。在这一系统中可以允许更多地音符同时发声，系统可允许同时发声的音符数已经提升到5个，有着较好的音符切分识别效果[3]。在进入到90年代之后，Hawley在其研究中发表了有关于听觉图像分析方面的研究，在这一钢琴音乐切分音符的识别方法中取得了相对较为完善的效果与方法。英国学者Douglas Num在具体的研究中提出应用启发式信号处理方式，在这一模式下音乐识别系统可以处理的同时发声的音符数目可以达到8个[4]。但是在实际的问题处理中，Douglas Num所研究的方法的主要研究方向是识别结果与输入音乐的听觉感知一致性，所以在具体的音符处理中有着更高的容错率。但是却依然使系统在许多方面存在着不适用的问题。就目前的发展而言，在音乐的识别以及有关于和弦的认识方面，总体对音符识别关注度较低，在这一方面相关的研究也相对较少，但是在钢琴音符的识别方面对于钢琴辅助教学以及有关的乐谱记录等方面都是极为重要的，本文在研究中主要对多音符音频特征提取和音符端点的检测进行了详细的研究与描述[5]。2 研究方法2.1采样与量化方法音频在其与预处理的过程中，主要是将其中的音频模拟信号进行初步的技术处理，转化成为了适合计算机进行分类处理与识别的数字信号。在这一过程中，所涉及到的工作主要有音频的采样量化、预加重处理、加窗阶段。在这一系列的过程中，预处理主要是进行初步的信号模拟，从而可以更加便捷的进行信息处理[6]。钢琴音乐也是音频信号的重要分类之一，人耳在演奏厅中所听到的各种信息都是一种连续的，不间断的波形信号，也就是一种模拟信号，为了可以更加便捷的对主要的音频信号进行计算机的数字化处理，需要对模拟信号依据一定的周期来进行采样处理，从而在这一过程中可以得到稳定的信号序列。在钢琴信号的频谱分析中，其范围主要是集中在27.5Hz到4186Hz，并且在这一过程中利用奈奎斯特采样定理来分析，如果在选定的选样周期为 (1)T是周期，fm是频率在这一过程中采样后的信号可以进行对原信号的唯一复原[7]。所以在实际的钢琴音频信号分析处理中，采样频率（2）其中为采样频率，并且在这一计算中，=11.025kHz。在这一过程相类似的采样中，量化主要是将采样后的音频信号的振幅量化为一个有限幅度的集合，也就是所谓的幅度离散化过程，而在这一个过程中可以将其具体的分为量化以及编码的过程，从而获取更加准确的数据。2.2预加重与加窗方法而对于音频信号，其信号频率每提高两倍时，其功率则会伴随着下降，其下降幅度大约为6dB。为了进一步的增强其对高频信号的分析能力，首先便需要对音频信号中的高频信号部分来进行幅度的提升，具体的操作方式则是使用6dB倍频的预加重措施来对信号中的高频部分进行处理。在这一处理过程中，主要可以将其看做为进行信号的滤波处理，图1则是预加重滤波器波特图，在这一幅频特性曲线中可以清晰的看到，预加重过程可以对音频信号进行超过1000Hz的高频幅度处理[7]，从而极大的提高了整体的信号高频处理分析能力。Figure 1 pre emphasis filter Potter Figure 1此外，我们也需要看到信号加窗其主要目的是对所探测的音频信号来进行分段处理，从而更加方便计算机的分类处理，而其中音频信号帧主要是由窗函数w(n)与原信号s(n)进行相乘运算后得到，而在信号的时域分析中，往往会采用矩形床