- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于ICA歌―曲分离
基于ICA歌―曲分离
摘要:在进行音乐处理的时候,很多情况下需要将歌曲中的歌声和背景音乐分别提取出来。本文主要基于独立成分分析和小波变换两种核心理论,对歌曲中的歌声和背景音乐进行分离。
关键词:歌曲分离 语音分离 独立成分分析 小波变换
中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2011)06-0178-02
1、引言
歌曲中包含的信息很多,单纯地获得整体的歌曲信息有时不能满足人们的需求。例如录音信号里单独提取出有效的语音,而略掉嘈杂的背景声;卡拉ok中提取出歌曲的伴奏部分;还有歌词的自动跟踪,将歌声分离出来,可更准确地匹配歌词。本文提出一种“歌―曲”分离方案,将歌曲中的歌和曲进行分离,以应对各种需要单独利用其中某一信息的场合。
2、问题介绍
在歌声和伴奏混合的歌曲中,认为歌声和伴奏是相互独立的,并且是歌声和伴奏经过线性混合得到的,只是混合矩阵未知。那么可以应用独立成分分析(Independent Component Analyse,简称ICA)来将歌声和伴奏乐曲分开。
在标准的ICA分离应用中,要求观测量的个数大于或者等于独立源的个数。研究歌曲中的歌声和背景音乐,要求至少有两个观测分量才能将独立信源分离出来。而在实际中,通常只有一路观测信号x1(t)作为已知信号。这就遇到了一个问题:观测信号的个数少于独立源的个数,即欠定ICA问题,这种问题是无解的。
因此在应用ICA之前,要构建一个信号作为观测信号x2(t),才能得出两个独立的源信号s1(t)和s2(t)。
利用小波变换(Discrete Wavelet Transform,简称DWT)将信号分解成不同的频率成分。给不同的频率成分不同的增益,再通过小波反变换(IDWT),就可以得到不同的重建信号,得到的信号可以作为观测信号,称之为“伪生成源”(Pseudo Source,简称PS)。得到的伪生成源和已知的歌曲文件均可作为ICA的估测信号。
3、分离过程
3.1 信号预处理
将已知的歌曲文件进行归一化,均值变为0,方差变为1.
Δ=[σd*(X(i)-μd)/σ],
Xn(i)=μd+Δif X(i)μ,
Xn(i)=μd-Δif X(i)μ.
3.2 形成伪生成源(PS)
(1)离散小波变换(DWT)。
(2)增益处理。由于歌曲中的歌声和背景伴奏的频率在大部分情况下不重合,可以通过DWT,将歌曲分解成不同的频率成分。经过十级分解得到不同的位置系数CD1、CD2……CD10,以及尺度系数CA10。通过这些系数,可以将已知信号还原。同样,利用这些系数也可以产生新的观测信号,即需要的“伪生成源”。在产生不同的“伪”观测信号之前,需要给各个系数以不同的增益值。这样才能保证生成的“伪”源包含我们需要的频率成分,同时又与已知信号不同。
对不同系数的增益,有两种方案:(PS1、PS2分别代表两路“伪生成源”)
A、 常量增益法
PS1:频率最高的信号,其系数获得的增益最大;
频率最低的信号,其系数获得的增益最小。
PS2: 频率最高的信号,其系数获得的增益最小;
频率最低的信号,其系数获得的增益最大。
B、 变量增益法
PS1:能量最高的信号,其系数获得的增益最大;
能量最低的信号,其系数获得的增益最小。
PS2: 能量最高的信号,其系数获得的增益最小;
能量最低的信号,其系数获得的增益最大。
(3)产生“伪生成源”(PS)。
选择以上任一种增益方法,对位置系数(CD1、CD2……CD10)以尺度系数CA10进行处理,可以得到两组新的位置系数和尺度系数组合
(CD1_1、CD1_2……CD1_10)、CA1_10
(CD2_1、CD2_2……CD2_10)、CA2_10
将这两组信号进行IDWT运算,就可以得到两个重组的信号PS1、PS2,这两组信号就是“伪生成源”。
3.3 应用FastICA,分离信号
在该“歌―曲”分离中只需将歌曲中的歌声和背景伴奏分离开,因此只需两路观测信号即可。
在X、PS1、PS2中任选两路信号,作为ICA的待处理信号。将选定的两路信号进行预处理和提取独立分量,就可以提取出歌声和伴奏乐曲了。
4、“歌―曲”分离实验
本文所研究的语音分离,目的是将观测信号中的歌声和背景伴奏分离开。为了避免噪声以及声音反射带来的影响,实验选择的观察信号是相互独立的歌声信号与背景伴奏信号的线性叠加,因此用形成的混合信号记为实验期待得到的理想分离信号(如图1)。
将信号(1)进行归一化处理后,对归一化
您可能关注的文档
最近下载
- 《吸收合并方式下的企业合并绩效评价及风险应对》.docx VIP
- 湖北省恩施市2023-2024学年七年级上学期期末语文试题(解析版).docx VIP
- 南京理工大学《宏观经济学》内部题库练习期末真题汇编及答案.docx
- 一例子宫肌瘤患者的个案护理.doc VIP
- 2024年山东省政府采购判断题真题最新(2024年12月20日整理)第13套.doc VIP
- 2023年山东省夏季普通高中学业水平合格考试会考生物试题及参考答案.pdf
- GB 50128-2014 立式圆筒形钢制焊接储罐施工规范.pptx
- 手术室甲状腺癌个案护理ppt.pptx
- 彩绘娃娃项目创业计划书.pptx VIP
- 小学数学_除法的意义教学设计学情分析教材分析课后反思.pdf VIP
文档评论(0)