语音信号处理与现代语音通信.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 人机通信-语音合成原理 发音器官参数合成法(Articulatory Synthesis) 顾名思义,就是对人的发音过程直接模拟,根据人类发音系统的解剖图,可以将模拟参数分为声源参数(包括声门开度、声带张力、肺气压)、发音参数(包括舌尖高度、舌尖前后位置、舌体高度、舌体前后位置、小舌头位置)、辐射参数(嘴唇的开口度、嘴唇的突出度)三类,换言之合成器由上面这些控制部件组成,通过分析这些部件在发不同音时的参数取值组合,合成语音时时通过控制和调节这些部件参数来产生声波完成的,不过人类发音是个复杂的过程,准确提取这些参数不是容易的事情(否则语音编码和识别可以更加完善了)。 第八章 人机通信-语音合成原理 共振峰合成法(Formant Synthesis ) 语音学研究结果表明,决定语音感知的声学特征主要是语音的共振峰,本方法与线性预测参数合成法类似,也是基于语音产生的数学模型的,只是声道LPC模型,改为共振峰模型,而声道共振峰模型又是采用数字滤波器来实现的,可以调节滤波器频率响应中共振峰中心频率,带宽,包括频率响应的零点,这种基于谐振腔特性的合成系统,韵律特性明显(因为是振荡模型)。这种方法一般也是采用小发音基元,然后提取每个基元的共振峰参数,合成时将发音基元组成的音节连接起来,为了保证平滑过渡,一般要插值实现共振峰轨迹的圆滑过渡。 第八章 人机通信-语音合成原理 线性预测参数合成法(LP Synthesis ) 那就是我们已经研究过的语音产生的简化数学模型,只要将发不同音时的模型参数提取存储起来,合成时将对应参数取出驱动模型产生声音就可以产生相应的语音 基音同步叠接相加法PSOLA(Pitch Synchronization Overlap Adding) 一般的波形编码合成法,由于基本上不对合成基元作调整,只是拼接,因而只能合成比较大的语音单元,如词、短语、语句等,否则需要存储的基本单元太多;由于直接产生或者存储了声音波形,因此一旦可以合成,那么音质比较高;缺点是难以合成无限词汇的语音。 第八章 人机通信-语音合成原理 80年代末F.Chpentier 和E. Moulines提出基音同步叠接相加法PSOLA,使得在做波形拼接时能够灵活对小基元,如音素、音节等,进行基频、时长、和短时能量等韵律特征的调节,将这种编码合成法改变成具有规则合成法特征的新合成法,得到广泛使用。(所谓韵律特征prosodic feature指由音高、音长、音强、音色随时间的变化特征,它也叫超音段特征supra-segmental feature) 基本原理:如果s(n)是一个周期为Np的理想浊音信号,那么我们可以用2Np长的汉宁窗截取一段含二个周期长的语音,再以Np的滞后间隔叠接相加,就可以无失真地恢复原信号,因为汉宁窗是一个完整余弦波平移后获得的,即存在: 第八章 人机通信-语音合成原理 (假设N为偶数,等于余弦周期) 所以我们有: 当然,实际浊音信号并不是这么理想的周期信号,不能完全满足这种重构条件,但是我们可以通过对基频、时长、短时能量等韵律特征的修改,来保持合成信号的动态频谱包络接近原来语音频谱包络,不发生大的改变。具体做法是根据定义的频谱失真函数,最小化失真时考虑如何叠接,经过推导可以得到: 第八章 人机通信-语音合成原理 其中, 是调整后需要的时间位置,而 是调整前对应的位置,一般取 就是原来语音s(n)的基音位置,称为基音标注点;而 则是产生的合成语音的基音标注点。 和 是原始语音和合成语音的窗函数,可以取一样的,比如汉宁窗。 第九章 语音增强与消噪技术 §9.1 引言 一个实用的语音系统,如语音编码系统,语音识别系统等,在设计制造完成后处于现实工作环境中时,将遇到各种各样的环境噪声,比如公众场合中对手机讲话,手机中麦克风会将各种背景噪声与该用户的讲话一起,同时录入作为后续语音编码或者识别系统的输入。有时候此类噪声将使得在实验室环境下性能良好的语音系统性能恶化,甚至工作完全失效,因此设计语音系统时,必须考虑其工作环境的影响。 现实中噪声往往不可避免,所以需要我们采取各种措施,提高语音系统在噪声环境下的工作性能。 第九章 语音增强与消噪技术 §9.2 常见的噪声 1、周期噪声;比如电源中的50赫兹交流声,它呈现周期性。 2、脉冲噪声;比如语音系统正在工作时某种机器(吹风机、摩托车、打雷等)突然开动,此种噪声呈现能量大,

文档评论(0)

zxiangd + 关注
实名认证
内容提供者

本人从事教育还有多年,在这和大家互相交流学习

1亿VIP精品文档

相关文档