浅谈基于内容音乐检索匹配研究.docVIP

下载本文档

6
0
约2.61千字
约 6页
2018-06-08 发布于福建
举报
版权申诉

浅谈基于内容音乐检索匹配研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浅谈基于内容音乐检索匹配研究

浅谈基于内容音乐检索匹配研究　　摘要：基于内容的信息检索是随着计算机的发展而不断发展的，本文介绍了基于内容的音乐检索技术的发展过程，以及所涉及的类型和相关特点，系统的构成和发展趋势和未来技术难点。　　关键词：信息检索；音频检索；　　基于内容的音乐检索发展趋势及未来技术难点基于内容的检索是指从多媒体数据中提取出特定的信息线索，这种检索有别于经过人们加工后形成的主观描述性文字的检索，依据客观存在而进行，其内容包括视频、图像、图形和音频等表现出一定内容的数字化信息。　　一、对基于内容的信息检索的认识　　（一）基于内容的检索的定义。检索作为图书馆学中采分编检流中的一个重要环节，所谓基于内容的检索就是指根据媒体和媒体对象的内容语义及上下文联系进行检索，即基于内容的检索需要利用图像处理、模式识别、计算机视觉、图像理解等学科中的一些方法作为部分基础技术。　　（二）基于内容检索的类型。基于内容的检索主要有一下的类型：（1）图像检索。主要根据图像的颜色、纹理、形状特征，以及图像中子图像（目标，又称对象）的特征进行检索。（2）视频浏览和检索。基于关键帧的检索对代表视频镜头的关键帧进行检索。关键帧可以采用与图像检索相似的方法。而一旦检索到目标关键帧，就可以利用播放来观看它所代表的视频片段了。（3）音频检索。利用神学和主观的特性来进行查询。声音的一些感知特性，如音调、响度、音色等，它们与音频信号的测量属性非常接近，因此可以在音频数据库中记录这些特征，并利用这些特征来进行示例和特定特征值查询。（4）图形查询。（5）文本查询。　　（三）基于内容的检索的特点。基于内容的检索是多媒体研究中的新兴热点，它有一下的特点：（1）从媒体内容中提取信息线索。直接对图像、视频、音频内容进行分析，抽取特征和语义，利用哲学内容特征建立索引，并进行所以。（2）基于内容的检索是一种近似的匹配。采用相似性匹配的方法逐步求精，来获得查询结果，即不断缩小查询结果的范围，直到定位于要求的目标，这是一个迭代的过程。（4）大型数据库的??速检索。实际的大型数据库不仅数量巨大，而且种类和数量繁多，因此要求基于内容的技术也像常规的信息检索技术一样，能快速实现对大型数据库检索。　　二、基于内容的音频检索的特征分析　　音频是声音信号的形式，作为一种信息载体，音频分为三类：（1）波形声音，对模拟声音数字化得到的数字音频信号，它代表语音、音乐、自然界和合成的声响；（2）语音，具有词字、语法等语素，是一种高度抽象的概念交流媒体，语音经过识别可以转化为文本，而文本是语音的一种脚本形式；（3）音乐具有节奏，旋律或和声等要素，是人声或和乐器音响等配合构成的一种声音，而音乐可以用乐谱来表示。　　在物理样本级，音频内容呈现的是流媒体形式，用户可以根据对音频媒体的划分，可以得出语音、音乐和其他声响具有显著不同的特性，因而目前的处理方法就相应地分为三种：处理包含语音的音频和不包含语音的音频，在后者中又把音乐单独划分出来。即第一种是利用自动语音识别技术，其他两种是利用一般性的音频分析，来适合更广泛的音频媒体，如音乐和声音的效果，而其中也包含了数字化语音符号，因此音频信息检索分为：语音检索、音乐检索和音频检索。　　（一）音频的数据类型　　为了满足音频管理和检索的需要，基于内容的音频检索数据模型需要提取音频的低层特征来表现音频的低层次内容。音频有心理属性和物理属性，因此对音频特征的提取也有两种方法：（1）提取听觉感知特征如音调、响度等一些明显的听觉特征（2）计算非感知特征或物理特性，如对数倒频谱系数、线性预测系数。不同的特征表达音频的不同方面，适用于不同的应用范围。　　（二）基于内容的音频检索的特点　　音频数据的训练、分类和分割方便了音频数据库的浏览和查找，基于听觉特征的检索为用户提供高级的音频查询接口。这里指的音频检索就是针对广泛的声音数据的检索，分析和检索的音频包含语音和音乐，但是采用的是更一般性的声学特征分析方法。（1）声音训练和分类（2）听觉检索（3）音频分割。　　四、基于内容的检索系统的系统结构　　（一）基于内容的查询系统构成。完整的基于内容的查询系统一般由两个子系统构成，即数据库生成子系统和查询子系统。每个子系统由相应的功能模块和部件组成。（1）对象标识（2）特征提取（3）数据库（4）用户查询和浏览接口（5）检索（匹配）引擎（6）索引/过滤器。　　（二）基于内容的查询和检索过程。基于内容的查询和是一个逐步求精的过程，检所经历了一个特征调整、重新匹配的循环过程。（1）初始查询说明。用户查找一个对象时，最初可用QBE（Query By Example 通过例子进行查询）或查询语言来形成一个查询。（2）相似性匹配。将查询特征与特征库中的特征按照一