- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络时代下音乐检索方法初探
网络时代下音乐检索方法初探
【摘 要】基于网络时代下,人们对于音乐作品的需要越来越多样化,个性化,现有的文字音乐检索方法已经不能适用于时代的需要。文章根据市场需要提出一个哼唱旋律的音乐检索方法,并展望了该方法广阔的市场前景和巨大的商业利润。
【关键词】文字检索方法;音乐检索方法;MIDI文件;检索算法
1.音乐检索的现状
进入网络新时代以来,艺术创意产业的发展受到高度的重视。艺术与技术有着天然的不解之缘,艺术借助技术的手段构建了艺术的“轮廓”,技术也因为有了艺术上的感觉获得了特有的“神情”。如何找到最合适的技术使艺术创意产业转换成生产力并且服务于现实的生活,这是个有着实际意义的科研项目。现在对音乐有许多的检索方法,但是如何快速准确的检索,这个就不是那么容易了。
随着多媒体和计算机网络技术的迅速发展,各式各样的数字信息呈现几何增长的爆炸态势,其中音乐信息资源的数量也是急剧增长。音乐信息资源是非结构化信息,许多是文字无法精准描述的。目前网络音乐资源呈现出几个特点:一是资源类型多,数量大;二是对音乐描述的文字方案繁杂,没有统一的标准;三是许多描述方案并不准确。因此,如何从浩如烟海的音乐信息资源中快速而准确的检索到想要的信息,已经逐渐发展为一个新兴的热门研究方向。
根据《第21次中国互联网络发展状况统计报告》显示:截至2007年12月31日,中国网民总人数达到2.1亿。在网络的各项用途中,中国网民的网络音乐检索率居各项网络应用之首,半年内已有86.6%的网民收听过网络音乐,还有71.2%的人半年内下载过音乐。如此看来,网络已经成为获取音乐、传播音乐的重要的途径。音乐检索已经渗透到人们的日常生活学习工作当中,有着清晰的发展前景和广阔的市场空间以及巨大的商业利润。
2.文字检索方法的局限
目前的音乐检索方法大多是文字检索,即根据乐曲的名字、曲作者、词作者、演唱者、国别、文件格式、演奏乐器等人工标注的文字信息来进行检索。但是随着音乐信息资源海量地增长,人工标注信息的速度远远无法赶上音乐信息增长的速度??而且用户对音乐检索提出越来越高的要求与期望,基于文本的检索方法检索出来的结果或者描述不详细、或者根本无法达到用户的需求,文字检索的方法已经无法满足用户。
为了能够快速、准确的对海量的无文字标注的音乐信息资源做出有效的检索,本文提出哼唱旋律的音乐检索方法。哼唱旋律的音乐检索方法是根据音乐的内容来进行检索,也就是根据音乐的旋律、节奏、音高、时长等音乐特征来进行检索的一种方法。人们经常记不清一些歌曲的歌名和演唱者,但是对歌曲中经典的旋律却难以忘怀,基于这种特征利用哼唱旋律的检索方法就具有无可比拟的优势。当人们需要检索音乐信息的时候,进入哼唱旋律的系统,只要哼唱出歌曲的一句或者几句旋律,即使不知道音乐作品的名字、词曲作者或者演唱者,也能很顺利的检索到需要的音乐信息资源。
3.音乐的旋律及表达
音乐的旋律就是由一系列能反映音乐主题的音符组成,能够充分显示音乐的内容特征。构成音乐的基本单位是音符,音符由三个因素构成——音调、响度、音色。音调与声音的频率有关,频率越高,音调越高。响度与声音的振幅有关,响度的决定因素有发声体振动的幅度和距离。音色与声音的波形相关,不同的乐器有不同的音色。音符还有一个重要特征——音长,又称时值,即每个音的延长的时间长度或节拍。由于音乐本身的特点,音乐检索不同于一般的音频检索,更不同于传统意义上的文字检索。
3.1 旋律特征的表达和提取
首先确定哼唱的主旋律,去掉非主旋律,这样可以找到最准确的主旋律。
其次用音乐的要素:音强、音色、音高、时值长短来描述旋律的特征。因为实际操作过程中,用户哼唱的时候音色或者强弱往往把握不准确,故用更多的音乐元素来表达旋律特征。
再次综合使用音高、音长和音强特征来表达旋律。对于用户的哼唱习惯的研究表明,人们很难准确地把握住每个音符的音高和节奏的变化,但是对于音高和时值大概的轮廓却能很准确的哼唱出来。因此采用音高差与音长比作为二维特征,这样就能将不同的旋律转化为具体的字符串。
绝对音高音长的序列是没有意义的,应采用相对音高音长序列来表示音高的升高、降低和相同的三种情况。当然能够更细化旋律的轮廓,会减少误差,有助于提高检索的成功率。用户在哼唱旋律时一般对音高比时长的把握更准确些,通过识别哼唱的旋律轮廓中音高的比重应该大于时长。
3.2 常用的音频文件格式的比较
根据音频文件记录声音的原理,通常可以分为三类:声音文件、MIDI文件和模块文件。声音文件(wav、aiff、au、mp3、ra、wma等)指的是直接记录了通过对真实声音的模拟波形进行二进制采样而得到的数据,是对声音的真实反映。但是这样存储
原创力文档


文档评论(0)