基于ICA的语音分离技术课件.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于ICA的语音分离技术课件

项目总结 设计动机 Siri语音助手、微软公司的Cortana和谷歌的Google Now。这些软件现在已经是在我们生活当中使用了,而语音助手中最重要的一环就是对用户输入的语音信号的识别。语音信号的采集比较简单,但是对语音信号的处理就是一项比较复杂的工作了。 语音信号处理的目的就是要得到某些语音特征参数以便高效地传输或储存;或者是通过某种处理运算以达到某种用途的要求,例如人工合成语音、辨识出讲话者、识别出讲话的内容、进行语音控制等等。 问题分析 盲信号分离问题是信号处理中一个传统而又极具挑战性的课题。BSS是指仅从观测的混合信号(通常是多个传感器的输出)中恢复独立的源信号,这里的“盲”是指: (1) 源信号是不可观测的; (2) 混合系统是事先未知的。 本项目主要是基于独立分量分析(Independent component analysis,ICA)技术的盲源分离。基本思路是以非高斯信号为研究对象,在独立性假设的前提下,对多路观测信号进行盲源分离。在满足一定的条件下,能够从多路观测信号中,较好地分离出隐含的独立源信号。 需求分析 多年来,随着科技的发展,人们接收着大量的图像和声音信息,用传感器检测包含信息的信号,并通对这些信息进行加工来获得知识和改造自然的能力。然而传感器检测到的往往是多个未知成分混在一起的信号。在传感器检测方面人们一直追求对真实源信号的检测,新原理新方法新技术不断出现,如尽可能将传感器布置靠近源信号位置,采用多个传感器等措施来检测真实的源信号。由于检测到的信号是混合信号,因此对于有些情况(如公共场合信号等)中的真实源信号检测就更加困难。 所以就需要一种能够比较好的对收到的信号中的独立源信号分离的方法。我们这个项目进行的是初期的研究,也就是在理想的低噪声环境下来进行的模拟仿真实验。 系统设计2.1、系统简介CA算法来实现语音信号的分离,所以我们需要有信号的输入、FastICA语音信号分离和最终结果语音信号的输出。我们决定采用的MATLAB来进行仿真,因为我们比较熟悉的就是MATLAB仿真平台。 2.2、系统结构分析首先在语音信号的输入方面 在混合三个语音信号方面是利用矩阵的方式将三个信号处理到一个矩阵中。再通过一个随机权矩阵与合并的信号矩阵进行乘,得出我们处理过的混合信号。对混合后的观测信号我们做ICA前的预处理。实际接收的数据是复杂而繁多的,其中包含有用信息和无用信息,特别是传感器数量较多时,计算就很复杂,这时对观测数据进行预处理,能在一定条件下降低数据维数,减少后面处理的计算量。在ICA处理之前,通常先要对观测数据进行预处理,预处理主要有信号的中心化和白化。 信号中心化是将观测信号X减去其均值E{X},有X’=X-E{X}这样E{X’}=0,叫做信号X的中心化。在解混合之后,再将均值向量加回到解混得到的信号中去。 白化过程是对观测信号X实施线性变换到V,即V =MX,且使得E {VV’} =I,其中M为白化矩阵。该变换仅仅是去掉了观测信号X之间的相关性。若要达到降维的作用,可对其协方差阵进行特征值分解,起到降维作用。 通过FastICA算法对预处理后的数据进行处理,对信号进行特征提取处理。 图1 快速 初始化w(0),令其模1,置k=1; 期望值可由大量x向量的采样点计算出来; 用||w(x)||去除w(k); 如果|w(k-1)|不是足够接近1,那么令k=k+1,返回第(2)步,否则输出w(k)。 2.3、系统层次 详细设计 出于对分离结果的直观性考虑,本次仿真主要通过以下方式进行: 1、鉴于声音文件的图像不够直观如下图,我们通过两个主函数通过不同的形式来完成仿真(main_ica.m主要完成对声音文件的分离;main_ica_fig.m主要完成对通过程序产生的信号的分离)。 2、 图2 函数调用流程图第一层 3.2、第二层 3.3、第三层(如下图) 原型设计 4.1、前期准备 ATLAB仿真软件,这个软件我们在以前的课程中学习过,所以掌握起来比较容易。在知识储备方面我们选择了两本书《独立分量分析的原理与应用》[1]《独立成分分析》[2]。我们的仿真需要有音频信号的输入,所以就需要音频文件,这里使用的是an.wav、usic.wav、ragen.wav。4.2、设计方法通过自上而下的设计方法来设计我们这次的系统,所以在MATLAB中建立了一个main文件,这个文件是我们系统的核心文件,而当中的标准化和白化等都采用函数调用的方法来实现,所以主函数是比较简洁的。而调用的函数有mean_ica.m,white_ic.m,fpica.m,fastica.m。 前期我们准备的是对信号的混合,然后将混合后的信号输出来测试我们的混合效果如何。 中期就是对混合后的信号进行标准化和白化然后再用ICA

文档评论(0)

jiayou10 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档