基于哼唱技术的研究.docxVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于哼唱技术的研究

基于内容的哼唱检索 前言 随着信息技术和网络技术的发展,人类社会积累了大量的多媒体数据,而且数据量持续、快速地增长。如何实现多媒体信息的检索, 能从海量的多媒体数据中找到用户需要的信息从而更好地利用已有的信息资源是一个迫切要解决的问题。多媒体数据库技术就是研究如何管理和存储文本、图像、音频、视频等多媒体数据并提供对这些数据进行有效的检索机制的技术。所谓基于内容的检索是对媒体对象的内容及上下文语义环境进行检索, 如图像中的颜色、纹理、形状,视频中的镜头、场景、镜头的运动,声音中的音调、音强、音色等。基于内容的检索突破了传统的基于文本检索技术的局限,直接对图像、视频、音频内容进行分析, 抽取特征和语义,利用这些内容特征建立索引并进行检索。 ADDIN NE.Ref.{500A813E-3219-482D-9B2B-27FA670CE874}[1] 音乐与人的听觉感知紧密相关,它更多地传达了一种感情,一种很难量化的情绪,音乐的这种特性决定了在音频的分类检索技术中所用到的歌名、演唱者等外在信息对音乐分析并不适用。当前绝大多数的音乐搜索引擎都是基于内容的检索。基于内容的检索方法则是直接对媒体内容进行分析,抽取特征和语义,然后利用这些内容特征建立索引并进行检索。 ADDIN NE.Ref.{CA9FE701-3F0A-48D3-8A70-9C6CC49F30C3}[2]常规的信息检索研究主要基于文本,例如我们熟知Yahoo1com ,G 等,他们都是使用歌曲的名称、演唱者、作者或者歌词等来建立索引架构供用户使用。 ADDIN NE.Ref.{EB340016-4DBD-4020-8318-22B30462D2AC}[3-4]但用户经常会遇到这种情况,他能记得歌曲的某些片断,却无法想起歌名或演唱者等信息,利用上面搜索引擎无法找到目标歌曲。何况随着数字音频数据的迅速发展。 ADDIN NE.Ref.{EB340016-4DBD-4020-8318-22B30462D2AC}[5]特别是对于大型音乐数据库来说,,非常需要快速存取此类型的数据。 基于内容的方法是一个不错的选择,至少是对基于构造描述方法的补充。使用哼唱检索技术(query by humming,QBH)可有效地解决上述问题,哼唱检索是一种基于内容的音乐检索方式,它通过用户哼唱来进行检索,相对于传统的使用歌名、演唱者等外在信息的检索方式,它是根据音乐的旋律、节奏等内在特征来进行检索。 ADDIN NE.Ref.{EB340016-4DBD-4020-8318-22B30462D2AC}[6]因此相对于传统的关键字形式的用户接口,哼唱检索使用户能得到更佳的搜索体验。 正文 哼唱系统的构成 基于内容的音乐检索是根据音乐的内容特征来进行检索,也就是根据音乐的旋律、节奏等音乐特征进行检索。基于内容的音乐检索通常采用下面的通用的步骤:首先用话筒对用户的哼唱进行采样,然后对其预处理、端点检测,从而提取出特征信息。最后把提取出的特征信息和音乐库的信息对比,返回相似度最高的前若干首歌曲信息给用户。 音乐库的建立 音乐数据库包括原始乐曲库和乐曲特征库。在原始乐曲库中音乐以mp3,midi,rm等格式存储,对原始乐曲数据进行处理, 抽取表示乐曲主旋律的特征序列建立乐曲特 征库。 基于内容的哼唱检索的关键技术 (1)音乐信号数字化 a.音乐的基本概念 按照音乐理论,在音乐中使用的、有固定音高的音的总和。叫做乐音体系。音阶指调式中的各个音, 从以某个音高为起点即从主音开始按照音高次序将音符由低至高来排列这样的音列称为音阶。两个音级在音高上的相互关系叫做音程。音乐是由一系列音符序列组成。在乐谱表上表示正在进行的音的长短+音长也叫音值, 的符号叫作“音符”。每一个音符包含四部分特征? 音高、音长和音强、音色。音高代表了音符的高低, 旋律中音高才是音乐旋律的根本特性。音长说明了音符的长短。 旋律也叫曲调是按一定的高低、长短和强弱关系而组成的音的线条,它在音乐作品中占有最重要的地位—表现音乐内容的最主要的手段。人在听了一首乐曲后,记住的就是旋律。 节拍是音的强弱规律,即强拍和弱拍的组合规律,也就是说节拍是按拍号要求相隔一定时间反复出现重音的模式,或者说,它是固定的强弱音循环重复的序列。每一种节拍都由时值固定的单位构成,这种节拍单位叫做拍子。拍子的时值可以是四分音符、二分音符。也可以是八分音符。节奏是旋律地骨骼,是旋律发展地内在动力。节拍和节奏在音乐中永远同时并存、不可分离。 b.音乐的数字化表示 要提取音乐的旋律特征以构成表示音乐的音符序列先必须确定使用什么格式的音乐文件作为旋律提取的数据源。目前常用的计算机音乐文件格式有多种每种格式能支持的音频参数和使用环境各不相同。下面先对这些常用

文档评论(0)

wannian118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档