基于GMM和码本映射相结合的语音转换方法研究-信号与信息处理专业论文.docxVIP

  • 6
  • 0
  • 约4.85万字
  • 约 76页
  • 2019-01-04 发布于上海
  • 举报

基于GMM和码本映射相结合的语音转换方法研究-信号与信息处理专业论文.docx

基于GMM和码本映射相结合的语音转换方法研究-信号与信息处理专业论文

基于 GMM 和码本映射相结合的语音转换方法研究 专 业: 信号与信息处理 硕士生: 王明明 指导教师:王民 教授 摘要 人体发出的语音中包含有各种各样的信息,如说话人语义信息和说话人个性特 征的信息等。经常需要用语音信号处理领域的相关知识来分析与处理其中包含的 深层次信息。而语音转换技术是近年来语音信号处理领域的一个新分支,也是目 前语音信号处理领域的一个研究热点。对语音转换技术的研究主要是以语音的个 性特征信息为切入点展开的。语音转换技术就是对一个说话人的个性特征信息进 行转变,并保持语义信息不变,使其变为另一个特定目标说话人的个性特征信息。 对语音转换技术的研究有助于推动语音信号处理其它领域不断向前发展,甚至对 目前比较热门的智能家居及人工智能领域的研究起到促进作用。其具有广阔的应 用前景和巨大的理论研究价值。本文的主要工作如下: 从语音产生模型入手,介绍了发音系统的数学模型及常用的语音特征参数。并 对语音转换技术中的分析合成模型等基本理论进行了简要介绍。提出利用 KLD 将 源和目标特征参数进行对齐的方法,该方法减少了查找源和目标空间之间最近邻 域的搜索空间,也减少了计算量。 重点研究了高斯混合模型以及矢量码本映射两种谱包络转换方法,分析了它们 的优缺点。针对用 GMM 转换后语音的谱包络过于平滑的现象,研究了利用码本 映射法对 GMM 转换函数中的均值项和相关项进行修正的方法,以此增大转换特 征的离散程度,进而改善转换语音的质量。 研究了基音频率变换方法。目前对基音频率的变换基本上都是对基音频率和声 道谱参数分开进行建模的,这必然会影响转换后语音的音质。本文采用了基于径 向基函数网络的基频变换算法。该方法用径向基函数网络在基音频率与声道谱参 数之间建立联系。使得转换出的基频能够跟随目标基频起伏变化,并含有更多的 目标说话人个性特征信息。 对上述改进方法进行仿真测试,主观和客观测试结果都表明,改进的语音转换 方法提高了转换语音的质量,得到了较好的转换效果。 关键词:语音转换;基音频率;高斯混合模型;谱包络转换 Voice Conversion based on GMM and Codebook Mapping Specialty:Signal and Information Processing Name: Wang Mingming Instructor:Prof. Wang Min Abstract Human voice contains a variety of information,Such as speaker’s semantic information and speaker’s personality characteristics information. Often need to use the knowledge in the field of speech signal processing to analyze and deal with the deep information contained therein. Voice conversion technology is not only a new branch of the speech signal processing in recent years, but also a research focus in the field of speech signal processing At present time. Personality characteristics information is a mainly starting point for the research of voice conversion technology. Voice conversion is a technology that change one speaker’s personality characteristics information and keep the semantic information Unchanged, so that it becomes another specific target speaker’s personality characteristics information. Research on voice conversion technology will help drive the other areas of speech signal processing development continually. Even play a Positive role for th

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档