一种新的哼唱音符音高划分方法.docVIP

下载本文档

2
0
约6.03千字
约 9页
2018-04-06 发布于北京
举报
版权申诉

一种新的哼唱音符音高划分方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种新的哼唱音符音高划分方法　　摘要：哼唱音符音高的准确划分，对哼唱音乐检索系统识别率的提高起着很大的作用。目前，大部分的哼唱音乐检索系统都是采用能量划分的方法，在很大程度上并不能对哼唱波形文件顺利完成单音切割，因此，论文提出的一种新的音符音高划分方法，在基于一般能量划分的基础上，采用基于倍音列的音高识别模型对划分结果进行二次划分、规整，最终实现哼唱音符音高的划分。实验表明，该划分方法能够有效地实现哼唱音符音高的准确划分。　　关键词：哼唱；音符；能量切割；检索；倍音列模型　　中图分类号：TP311文献标识码：A文章编号：1009-3044(2011)10-2384-03 　　A New Method of Note Segmentation for Humming Music 　　YANG Jian-feng, FENG Yin 　　(Cognitive Science Department, Xiamen 361005, China) 　　Abstract: The accuracy of note segmentation of humming music is very important for the recognition rate of humming music retrieval system. Currently, most humming music retrieval systems, adopting the method of energy segmentation, can not successfully complete the single-tone segmentation of humming music. Therefore, a new method’s proposed in this paper, which based on the traditional energy segmentation method and overtone series model. The experiments show that the new method proposed in this paper can effectively completes the single-tone segmentation of humming music. 　　Key words: humming; note; energy segmentation; retrieval; overtone series model 　　随着信息技术的飞快发展，网络上的信息资源也呈爆炸性的增长。基于文本的信息检索技术已经相对比较成熟，然而对于基于内容的音频等多媒体信息检索的研究仍寥寥无几，单纯的文本或数值信息的检索方式已经远远不能满足应用的需求。因此，研究一种更为自然、方便、人性化的音频信息检索方式对于信息检索技术的发展是一项非常有应用价值的工作。其中，哼唱音符划分技术是基于内容音乐检索系统研究的重中之重[1-2]。本文旨在传统音符划分的基础上，采用一种新颖的音高识别方法进一步对划分的结果进行二次划分，最终有效地实现了哼唱音符音高的划分。　　1 基于倍音列的音高模型　　在介绍倍音模型之前，需要先引入基本乐音听觉能力的定义[3]。　　1.1 基本乐音听觉能力定义　　哼唱者A是具备基本乐音听觉能力的，如果A能通过他（或她）的听觉判明同时播放的任意二个音或哼唱旋律中依次播放的前后二个音是否为：　　1）同度（或相差若干八度）音程关系　　2）相差半音音程或更大音程的非同度关系且辨明哪一个音的音高更高（或低）　　1.2 单音哼唱定义　　设哼唱者A具备基本乐音听觉能力，称哼唱SH为单音哼唱，如果SH可由A的听觉，判断为仅包含唯一一个确定音高且为单音节的哼唱。　　于是，我们可以把任一哼唱H视为一个单音哼唱序列SH1, SH2,…,SHN（N≥1）。需要说明的是不少歌手对其哼唱往往会实施一些技术性的处理。例如，在半音到全音音程范围内上下颤动以润色某一哼唱音等等。这里，我们不考虑这些情况。因为具备这种能力的哼唱者同样有能力在其哼唱时尽可能地去掉这样的哼唱技术而不影响旋律哼唱的正确性。　　根据倍音列理论[4]，一个有确定音高的乐音是一种复合音。它由基音及其倍音（也称谐音、泛音）组成。基音的音高就是人耳听到的这个乐音的音高（基频音高）。而其它的倍音成分决定这个音的音色。任意一个有确定音高的人声哼唱音就是一种复合音。其中，基音及其倍音构成这个复合音的倍音列（也称泛音列）。它们分别称为：1倍音（基音）、2倍音、3倍音、……一般地，若一个复合音T的音高频率是FT，则它的K倍音的音高频率