考虑帧间信息的语音转换算法.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
考虑帧间信息的语音转换算法 简志华 王向文 杭州电子科技大学通信工程学院,浙江杭州310018 摘要:传统的加权频率卷绕算法是单独地对每帧语音特征参数进行转换,没有考虑到语音帧前后 的相关信息。针对这一点,该文提出了一种改进的加权频率卷绕算法,它利用压缩感知理论提取 语音信号的帧间相关信息。在进行转换时,该算法是相当于对语音段进行转换。客观测试和主观 听觉评测表明,虽然改进后算法的性能会受到语音段长度的影响,但当选择合适语音段长度时,性 能要好于传统的加权频率卷绕算法。 关键词:语音转换;压缩感知;频率卷绕;高斯混合模型 TN911.23 A 杭州电子科技大学学报 2012正 数为: M p(z)-i;dtN(z;弘;,∑;) (1) 式中,仅i是权重,斗:和∑;分别表示第i个分量的均值向量和协方差矩阵,M表示高斯分量的总个 数为: 叫:;】 ㈤ ∑一∑;1∑l J 【∑j1 ∑y 空间的均值矢量,利用这两个均值矢量所对应的频谱就可以相应地得到第i个子空间的频率卷绕曲线 函数职∽。因此,对于语音帧x。来讲,完整的频率卷绕曲线函数为…: M 形‘“’(力=.∑pi(x。)形(力 (3) 式中,Bi(x。)是后验概率为: 0【iN(g:;弘f,乏F1) Bi(g:)= (4) 旷————————一 j善djN(g:;pigx,∑F) 从式3可以看出,不同的语音帧具有不同的后验概率分布Bi(X。),因此每帧语音具有不同的频率 卷绕函数。 2 MWFW转换算法 wFw算法是单独对每帧语音的特征参数进行转换,没有考虑到语音帧间的相关性。而事实上,语 音帧间的相关信息具有重要的作用,为了利用语音帧间的相关性,同时也考虑到在转换时,语音段比语 音帧更具有稳定性,有利于提高语音质量,本文采用cs理论来提取语音帧问的相关信息。 cs理论指出,只要信号是可压缩的或在某个变换域是稀疏的,那么就可以用一个与变换基不相关 的观测矩阵将高维信号投影到一个低维空间上,然后通过求解一个优化问题就可以从这些少量投影中 以高概率重构出原信号o。 由于线谱对参数具有良好的量化和插值特性,使它成为目前语音转换中使用最为广泛的特征参数。 假定x。是当前时刻语音帧的LSP参数,即L维的列矢量,则X。一(r一。y2,…,x。一。,X。,x。+1,.一, x。+。T一。砼是一以x。为中心的由r(T为奇数)帧语音LSP参数构成的矢量序列。将这一矢量序列按时间 先后顺序拼接起来形成一个长的矢量为: X。=[X:一(r一1y2,…,X:一l,xT。,X:+1,…,X。1+(t一1y2】1 (5) LX1维的列矢量。由于联合矢量x。在DCT域具有很好的 式中,符号“T”表示转置,则x。是一个r 稀疏性,其大部分的系数都为零或者接近于零。这说明在DCT域,联合矢量X。采用压缩感知理论是完 全可行的。令观测矩阵西为一个D×rL维的高斯随机矩阵为: g:=mX。 (6) L/专)]。其中符号r·]表示 根据cs理论,D可以是一个比rL小得多的值,在本文中,D=『考l

文档评论(0)

bhl0572 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档