第四讲数字音频技术new.ppt

语音合成关键技术 PSOLA(基音同步叠加)合成技术 该技术主要着眼于通过参数对语音的韵律进行控制和修改。在拼接语音波形片断之前,首先根据上下文,对拼接单元的韵律特征进行调整,使合成波形既能保持原始发音的主要音段特征,又能使拼接单元的韵律特征符合上下文的要求,从而获取较高的清晰度和自然度。 优点 保持了传统波形拼接的优点,简单直观、运算量小,而且可以控制语音信号的韵律参数,合成自然。 * * 语音合成 韵律模拟 自然语言中的韵律特征 在自然语流中,人们使用语调、节奏和重音等方式来表达说话者的语义和感情,这些韵律特征是自然语流的重要组成部分。 * * 韵律模拟 韵律合成及方法 由于语音数据库中不可能把反映韵律变化的基元都选存进去,言语输出要想取得高质量,必须具备韵律合成的功能。语调、节奏和重音这些韵律特征是通过超音段特征——音高、音长、音强及频率分布的变化而表现出来的。因此,这些超音段特性的修改构成了韵律合成的基础。 目前,对超音段特性的修改可通过各种方法来实现,如修改基频模式、共振峰模式、PSOLA算法等。 * * 语音识别 语音识别技术 语音识别系统的分类 按可识别的词汇量多少划分 小词表语音识别:能识别词汇量小于100。??? 中词表语音识别:能识别词汇量大于100。 大词表语音识别:能识别词汇量大于1000 ???? * * 语音识别分类 按照语音的输

文档评论(0)

1亿VIP精品文档

相关文档