- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
考虑帧间信息的语音转换算法
简志华 王向文
杭州电子科技大学通信工程学院,浙江杭州310018
摘要:传统的加权频率卷绕算法是单独地对每帧语音特征参数进行转换,没有考虑到语音帧前后
的相关信息。针对这一点,该文提出了一种改进的加权频率卷绕算法,它利用压缩感知理论提取
语音信号的帧间相关信息。在进行转换时,该算法是相当于对语音段进行转换。客观测试和主观
听觉评测表明,虽然改进后算法的性能会受到语音段长度的影响,但当选择合适语音段长度时,性
能要好于传统的加权频率卷绕算法。
关键词:语音转换;压缩感知;频率卷绕;高斯混合模型
TN911.23 A
杭州电子科技大学学报 2012正
数为:
M
p(z)-i;dtN(z;弘;,∑;) (1)
式中,仅i是权重,斗:和∑;分别表示第i个分量的均值向量和协方差矩阵,M表示高斯分量的总个
数为:
叫:;】
㈤
∑一∑;1∑l
J
【∑j1 ∑y
空间的均值矢量,利用这两个均值矢量所对应的频谱就可以相应地得到第i个子空间的频率卷绕曲线
函数职∽。因此,对于语音帧x。来讲,完整的频率卷绕曲线函数为…:
M
形‘“’(力=.∑pi(x。)形(力 (3)
式中,Bi(x。)是后验概率为:
0【iN(g:;弘f,乏F1)
Bi(g:)= (4)
旷————————一
j善djN(g:;pigx,∑F)
从式3可以看出,不同的语音帧具有不同的后验概率分布Bi(X。),因此每帧语音具有不同的频率
卷绕函数。
2 MWFW转换算法
wFw算法是单独对每帧语音的特征参数进行转换,没有考虑到语音帧间的相关性。而事实上,语
音帧间的相关信息具有重要的作用,为了利用语音帧间的相关性,同时也考虑到在转换时,语音段比语
音帧更具有稳定性,有利于提高语音质量,本文采用cs理论来提取语音帧问的相关信息。
cs理论指出,只要信号是可压缩的或在某个变换域是稀疏的,那么就可以用一个与变换基不相关
的观测矩阵将高维信号投影到一个低维空间上,然后通过求解一个优化问题就可以从这些少量投影中
以高概率重构出原信号o。
由于线谱对参数具有良好的量化和插值特性,使它成为目前语音转换中使用最为广泛的特征参数。
假定x。是当前时刻语音帧的LSP参数,即L维的列矢量,则X。一(r一。y2,…,x。一。,X。,x。+1,.一,
x。+。T一。砼是一以x。为中心的由r(T为奇数)帧语音LSP参数构成的矢量序列。将这一矢量序列按时间
先后顺序拼接起来形成一个长的矢量为:
X。=[X:一(r一1y2,…,X:一l,xT。,X:+1,…,X。1+(t一1y2】1 (5)
LX1维的列矢量。由于联合矢量x。在DCT域具有很好的
式中,符号“T”表示转置,则x。是一个r
稀疏性,其大部分的系数都为零或者接近于零。这说明在DCT域,联合矢量X。采用压缩感知理论是完
全可行的。令观测矩阵西为一个D×rL维的高斯随机矩阵为:
g:=mX。 (6)
L/专)]。其中符号r·]表示
根据cs理论,D可以是一个比rL小得多的值,在本文中,D=『考l
文档评论(0)