- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
西北工业大学大生创新性实验计划项目申请书
西北工业大学
2011年大学生创新性实验计划项目
申 请 书
项目名称 哼唱检索中旋律匹配算法研究
所在学院/基地 电子信息学院 申 请 人 商景瑞 导师姓名 联系电话 1座机电话号码48 E-mail: nputeam@
填表日期 2011年3月24日 西北工业大学教务处制表
项目名称 哼唱检索中旋律匹配算法研究 起止时间 2011年4月至 2012年6月 申请经费 8000元 申请人或申请团队 学 号 姓 名 年级 所在学院、专业 联系电话 E-mail 商景瑞 大一 电子信息学院通信工程 1座机电话号码48 nputeam@ 宋燕秋 大一 材料学院 座机电话号码71 岳明 大二 航海学院电子信息工程 宋金梦 大三 航海学院电子信息工程 导师 姓 名 学院 职务/职称 E-mail 电 话 一、申请立项依据(包括项目背景、项目来源、技术依据、前期已有的研究基础,自身具备的知识条件、自己的兴趣爱好、特长等)
1、项目背景
随着网络多媒体数据和数据库应用的增加,如何对这些数据进行自动分类和检索已成为一个研究热点。尤其对音频而言,由于出现越来越多在线音乐存储和音乐检索,这就需要一种更加有效的机制去组织检索这些海量数据。基于文本的传统检索方式只能对有标注信息的音乐文件进行检索,基于内容的检索则不依靠标注信息,而是根据音乐中的旋律、节奏、音色等信息进行检索研究意义)
在这个过程中如何将哼唱产生的音乐旋律与已有的模板数据库准确进行匹配并由模板数据库链接到歌曲数据库这就涉及到用音乐的哪些特征信息作为可用来匹配的参数(这些参数能够反映歌曲之间的不同点)这些参数以什么形式进行组织或是表示可以用来一对一的匹配。初步有两种可能的解决途径。
参数函数法
选定反应歌曲本性特征的几个重要参数,这写参数构成了音乐的特征函数S.若由哼唱产生的音乐特征函数为S1,从模板数据库提取出来的匹配音乐特征函数为S2,现在就只需要比较两个函数的相似程度即可。不妨设d ls1-s2l,在函数上分别取点然后计算d值,以求出最小的d值为最佳匹配结果并输出。应用此法的话涉及到优化的问题,一般可采用的算法有DTW算法(时间规整算法)、HMM(马尔可夫)模型等。
音符字符化
此种方法比较传统,通常是以音高来作为可匹配的参数,由音高的变化生成一系列的字符串,然后通过字符串的相似程度比较来实现音乐旋律的匹配,需要用的算法基本上与方法相同。
其实两种方法的实质都是利用音乐的本质特征作为匹配的依据,这些特征通常也都是通过某种方式的转化变成可以用计算机解决的匹配类问题,在此过程中必然会牵扯到匹配算法的选择以及改进。如何选择好的算法以及完成对算法的进一步优化以提高算法效率是我们需要重点研究的课题,在明确匹配思路的同时也更需要我们在已知算法的基础上通过采用一种算法或综合采用多种算法的方式能够较好较准确的完成匹配这一环节。
四、国内外研究概况
目前国内外对于基于内容的音乐检索的匹配算法研究已经被大量提出。1995年,Ghias将歌曲转换为音调轮廓信息进行匹配,将连续音符的音高变化归纳成升高、降低和不变三类,分别用三个字符:S-same、U—up、D-down来表示音乐的旋律轮廓,将音乐的旋律转换成字符串,使用了字符串匹配的相似度方法进行检索。旋律匹配是通过近似字符串匹配算法来完成的。但该方法需要从哼唱输人中精确分割出一个个音符,这在实际中一般是很难做到的。而且在旋律匹配中,以巨大的运算量来获得音调调整的准确性,随着音乐数据库的增大,这类方法越来越显得不足。
随后便有人提出了应用长半音音阶模型来估计midi和哼唱输入的参考音高,通过对这两种音乐特征的分析作为匹配的依据,这种匹配算法运算量低但准确度高。而在实际应用中,越来越大的音乐数据库中不符合长半音音阶模型的歌曲越来越多。
目前为止,对于基于内容的音乐检索的研究如雨后春笋般地发展起来。国内中国科学院声学研究所在哼唱检索方面开展了工作,另外如浙江大学、上海交通大学、西北大学等也在基于内容音乐检索方面开展了研究工作,而且工作都主要集中在对匹配算法的改进以及对系统的优化之中,提出了好多时兴的算法如动态时间规整(DTW)、隐马尔科夫模型(HMM)等等。自此对于哼唱检索中的匹配算法研究工作正如火如荼的开展和进行之中,而匹配作为检索的关键环节也在不断的改进和完善。 五、研究方法、技术路线及研究中面临的技术难点和拟采取的解决办法
技术难点:
1、准确度与检索速度的取舍
准确度与检索速度是个相互矛盾的问题,侧重精度,则会导致速度的减缓,而侧重速度,侧有可能导致精度达不到预期要求。
2、端点检测的方法
如何使计算机确定用户哼唱片段的起始位置。
3、原声与用户的语音差异
人与人之间语音的频率
文档评论(0)