- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章-语音信号的数字模型管理
设宽带稳态随机信号为 ,其方差为: 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.16) 或, (2.17) 式(2.17)中, 是 的自相关函数。 * 带噪语音信号 ,为纯语音信号 与噪音 之和,则其Teager能量算子如式(2.18)所示: 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.18) 式中, 是 与 的互Teager能量,如式(2.19)所示: (2.19) * 因为 和 相互独立且均值为零,故 的期望值为零,可以推导出: 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.20) 上式(2.20)中, 相对于 可以忽略不计,则可以得到: (2.21) * 最后,Teager能量算子在离散域的表示形式如式(2-22)所示: 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.22) 其中, 、 、 分别是当前样点、前一个样点和下一个样点值。 从上式(2.22)可以看出,计算能算算子在第 点处的输出值,只需知道该样点和它前后时刻的值,计算量小的同时也保证了能量算子输出后的信号依然与原始信号具有相似性。 * 3)能量分离算法 能量分离算法(Energy Separation Algorithm, ESA)使用非线性能量算子跟踪语音信号,将只包含单个共振峰的语音信号分离成频率分量和幅值分量。其中单个共振峰的调制信号表示如式(2.23)所示: 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.23) 其中瞬时频率为 。 * 对上述信号进行能量算子操作可以得到如下结果: 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.24) 从上式(2.24)可以看出, 的能量算子输出由两部分组成,一个是频率调制后的瞬时频率;另一个是幅值调制后的幅值包络。 * 上述结果显示了该算子的能量跟踪能力,因此将该算子称为能量算子。该能量算子可以反映出幅值与频率的变化。当幅值包络不变时,信号的能量算子就可以反映出频率的变化。 综上所述,该节所述的三种语音非线性产生模型中,语音信号的能量算子输出都是幅值包络与瞬时频率的函数,因此根据这两个输出可以分别求出瞬时频率和幅值包络,构建语音非线性模型。 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 * 非线性动力学理论是解决语音非线性建模问题的新理论,基本思想是依据语音信号的混沌特性及非线性时间序列分析技术,从定量的角度对语音的非线性动力学特性进行研究。 非线性时间序列分析方法大致可以分为两步: 第一,对一维语音数字信号数据序列进行空间重构,将一维时间序列映射到高维空间中。 第二,对重构后的语音信号进行特性分析。 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 3、非线性动力学模型 * Taken’s嵌入定理指出:选取合适的最小延迟时间 和嵌入维数 两个参数就可以将一维情感语音信号映射到高维空间实现相空间重构,且重构后高维空间与原始空间等价。 在高维空间里分析情感语音信号,进一步提取情感语音动力学模型下的非线性特征。 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 * C-C方法计算量小,对小数据组可靠且具有较强的抗噪声能力,可以在计算最小延迟时间的同时得到相对应的嵌入维数,计算方法如下。 (1)将时间序列 分成 个不相交的时间序列,每个子序列的长度为 ,形式为 。 (2)定义每个子序列 为: 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.25) 其中 为关联积分函数。 * (3)计算以下三个量 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 (2.26) (2.27) (2.28) * 根据上面式子,我们寻找 的第一个零点,或根据 第一个极小值寻找时间延迟 ;寻找 最小值即为窗口延迟时间 ,由 得到嵌入维数 。 2.4 语音信号的非线性模型 “十二五”普通高等教育本科国家级规划教材 * 实验所用的语音样本是柏林语音库录制的语音的一小段语音,采样率为16k
原创力文档


文档评论(0)