考虑帧间信息的语音转换算法.pdfVIP

下载本文档

0
0
约4.42千字
约 4页
2017-08-16 发布于安徽
举报
版权申诉

考虑帧间信息的语音转换算法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

考虑帧间信息的语音转换算法简志华王向文杭州电子科技大学通信工程学院，浙江杭州310018 摘要：传统的加权频率卷绕算法是单独地对每帧语音特征参数进行转换，没有考虑到语音帧前后的相关信息。针对这一点，该文提出了一种改进的加权频率卷绕算法，它利用压缩感知理论提取语音信号的帧间相关信息。在进行转换时，该算法是相当于对语音段进行转换。客观测试和主观听觉评测表明，虽然改进后算法的性能会受到语音段长度的影响，但当选择合适语音段长度时，性能要好于传统的加权频率卷绕算法。关键词：语音转换；压缩感知；频率卷绕；高斯混合模型 TN911.23 A 杭州电子科技大学学报 2012正数为： M p(z)-i；dtN(z；弘；，∑；) (1) 式中，仅i是权重，斗：和∑；分别表示第i个分量的均值向量和协方差矩阵，M表示高斯分量的总个数为：叫：；】㈤ ∑一∑；1∑l J 【∑j1 ∑y 空间的均值矢量，利用这两个均值矢量所对应的频谱就可以相应地得到第i个子空间的频率卷绕曲线函数职∽。因此，对于语音帧x。来讲，完整的频率卷绕曲线函数为…： M 形‘“’(力=．∑pi(x。)形(力 (3) 式中，Bi(x。)是后验概率为： 0【iN(g：；弘f，乏F1) Bi(g：)= (4) 旷————————一 j善djN(g：；pigx，∑F) 从式3可以看出，不同的语音帧具有不同的后验概率分布Bi(X。)，因此每帧语音具有不同的频率卷绕函数。 2 MWFW转换算法 wFw算法是单独对每帧语音的特征参数进行转换，没有考虑到语音帧间的相关性。而事实上，语音帧间的相关信息具有重要的作用，为了利用语音帧间的相关性，同时也考虑到在转换时，语音段比语音帧更具有稳定性，有利于提高语音质量，本文采用cs理论来提取语音帧问的相关信息。 cs理论指出，只要信号是可压缩的或在某个变换域是稀疏的，那么就可以用一个与变换基不相关的观测矩阵将高维信号投影到一个低维空间上，然后通过求解一个优化问题就可以从这些少量投影中以高概率重构出原信号o。由于线谱对参数具有良好的量化和插值特性，使它成为目前语音转换中使用最为广泛的特征参数。假定x。是当前时刻语音帧的LSP参数，即L维的列矢量，则X。一(r一。y2，…，x。一。，X。，x。+1，．一， x。+。T一。砼是一以x。为中心的由r(T为奇数)帧语音LSP参数构成的矢量序列。将这一矢量序列按时间先后顺序拼接起来形成一个长的矢量为： X。=[X：一(r一1y2，…，X：一l，xT。，X：+1，…，X。1+(t一1y2】1 (5) LX1维的列矢量。由于联合矢量x。在DCT域具有很好的式中，符号“T”表示转置，则x。是一个r 稀疏性，其大部分的系数都为零或者接近于零。这说明在DCT域，联合矢量X。采用压缩感知理论是完全可行的。令观测矩阵西为一个D×rL维的高斯随机矩阵为： g：=mX。 (6) L／专)]。其中符号r·]表示根据cs理论，D可以是一个比rL小得多的值，在本文中，D=『考l