- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
清 华 大 学 学 报 (自然 科 学 版)
法 。它利用特征参数之间的相关性 ,采用 Gauss混 矢量 z,计算后验概率 P(Vlz)(或 P(Ulz))。可按
合模型(Gaussianmixedmodel,GMM),用归一化 如下全概率公式计算 :
能量参数和 LSF参数对 u/V参数进行解码端恢
p(Vlz)一 丽 .
复 ,通过对长时能量 电平变化轨迹的有效跟踪提高
(2)
了系统的整体性能。
其中,p(V)表示语音帧为浊音 的概率。P(Vlz)为
1 基于 Gauss混合模型的子带清浊音恢复
估计的第 1个子带模糊清浊音度 ,即 一P(Vlz)。
算法 同理 ,对第 2~5子带的清浊音参数也可采用类似 的
低速率语音编解码器提取的 LSF、能量 、基音 方法 ,即得 ,i一2,…,5。
周期及 u/V等参数表征语音信号在某方面的特 最后 ,对估计的子带清浊音参数进行 以下两点
性 。然而,各个特征参数并不是孤立存在的,而是相 修正 :1)考虑到浊音误判为清音会对合成语音质
互之间具有很强的相关性 ,如浊音对应较高的能量 量产生较大影响,因此需要采用新的全带清浊音 门
电平,而清音对应较低的能量电平 ]。同时,汉语语 限T ,使得浊音误判为清音 的概率小于 1%,即
音的音素个数有限,各特征参数的组合概率不同,参 P(百T IV)O.01,并对第 1个子带的清浊音参
数之间也具有一定的统计相关性[6]。据此 ,可利用 数进行如下修正 :
参数之间的相关性,借助特定的概率统计模型,根据
一
一1』 ≥ . (3)
某一个或某几个特征参数对其他特征参数 的分布特 0, 百1 丁1。
性进行分析和估计 。为此,本文采用 GMM,通过 2)当第 1个子带为清音时 ,后 4个子带也一定
LSF和能量参数对 U/V参数 的概率分布特性进行 为清音。因此 ,若 T ,则 一o,一2,…,5。
估计。 按上述方法, ,i一1,…,5,即为最后获得 的
线性预测倒谱系数 (1inearpredictioncepstral u/V参数估计值。算法步骤可归结为 图 1所示 的
coef{icient,LPCC)以及 LSF参数均是表征语音信 框图。该方法存在 的问题是 ,u/V参数 的恢复效
号谱特性的参数,但是 由于前者较后者具有更优 的 果对不同能量电平 的鲁棒性较差 。例如,对于波形
线性特性 ,更适用于 GMM 模型,因此首先需将 完全相同而只有能量电平不 同的两段语音信号 ,它
LSF参数转换为 LPCC参数口]。u/V参数是 5维 们每一帧的LSF参数和 u/V参数是相 同的,而能
的矢量 ,用来描述语音信号在 5个子带 (分别为[O, 量参数却有一定差别 。因此 ,按照上述方法计算 的
500]Hz、[500,1000]Hz、[1000,2000]Hz、 极有可能会导致不 同的数值 ,与实 际的U/V参
[2000,3ooo]Hz、以及 [3000,4ooo]Hz)的模糊 数值不相符 ,而且能量 电平差别越大 ,性能下 降越
清浊音
文档评论(0)