成年人与老年人语音转换中期检查幻灯片.pptx

成年人与老年人语音转换中期检查幻灯片.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
成年人与老年人语音转换中期检查幻灯片

老年人与成年人语音转换;1. 语音转换的定义 2. 语音信号预处理 3.语音参数提取 4.语音训练 5.转换后的语音 ; 语音转换技术(VT, voice transform)是指改变一个说话人(源说话人,source speaker)的语音个性特征,是之具有另一个说话人(目标说话人, target speaker)的语音个性特征。语音包含许多信息,其中主要的是语义信息,另一个最重要的信息为语音的个性化信息。语音转化就是要保留语音的语义信息不变而改变语音的个性化信息。 ; 根据左图,语音转换需要两个过程 (1)训练过程:输入语音信号经过预处理后,语音信号的特征被提取出来,首先在此基础上建立的模板,这个过程叫做训练 (2) 转换过程:系统利用训练后的转换规则,用源说话人的参数来预测目标说话人的参数,最后利用预测参数来合成出转换后的语音。 ;左图为预经过预加重处理的一段语音信号 预加重处理的目的是为了对语音的高频部分进行加重,去除口唇辐射的影响。 ;通过传递函数为H(z)=1-az^-1的一阶FIR高通数字滤波器来实现语音信号的预加重处理(a为预加重系数,0.9a1.0);分帧一般采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移,帧移与帧长的比值一般取为0~1/2。;Function Sn=enframe(s) % 计算语音分帧后的帧数 nf=fix((length(xx)-256+80)/80) % 设定分帧后的帧长和步长 Sn=zeros(nf,256) Indf=80*(80;(nf-1)) Indf=(1:256) Sn(:)=S(indf(:,ones(1,256))+inds(ones(nf,1),:1) % 加入汉明窗 For i=1:nf Sn=sn(i,:).*hamming(256) end ; 实现语音转换的核心在于提取语音特征参数各声学参数对语音个性特征的贡献大小,学术内部也是各述己见。Matsumoto 研究认为基音频 率的贡献最大,其次是共振峰频率;Furui则认为由倒谱系数得到的平均谱包络贡献最大,其次为基音频率;Itoh等认为频谱包络贡献最大,基音频率位列第二。 ;本次毕业设计,我所提取的是线性预测参数(LPC) 线性预测参数不仅反映了它的预测功能,而且它提供了一个非常好的声道模型及模型参数估计方法; 从语音信号中分辨出语音信号和非语音信号,是语音处理的一个基本问题。 利用基于???量和过零率的语音端点检测方法—两级判决法及程序实现;通过转换算法进行语音分析,提取语音模型参数,之后将相同的参数聚集在一起作为训练数据。 转换函数描述的是源说话人与目标说话人参数之间的统计关系。 ;在孤立词语音识别中,最为简单有效的方法是采用DTW算法,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法,用于孤立词识别。 HMM算法在训练阶段需要提供大量的语音数据,通过反复计算才能得到模型参数,而DTW算法的训练中几乎不需要额外的计算。所以在孤立词语音识别中,DTW算法仍然得到广泛的应用 ; 首先用wavread函数读入wav文件,用lpc函数获得其lpc参数,用vad函数对其进行端点检测,并保存语音部分的lpc参数到参考模板的结构数组ref(i).lpc中或测试模板的结构数组test(i).lpc中。 模板匹配阶段,计算所有测试模板和参考模板之间的距离,保存到距阵dist中,将最后的匹配分数用min 函数找到最小值对应的模板。 ; 通过DTW算法对每个孤立字进行操作,分别得到这些孤立字的最小欧氏距离模板,以这个模板作为转换规则替换保存原孤立字LPC参数的矩阵,合成出转换后的语音 转换后的老年人声音 :syn_old man.wav 转换后的成年人声音:syn_young man.wav ;【1】吴晓平 .基于DTW的语音识别系统【J】.电子与信息学报.2004 【2】王华鹏. 利用MATLAB提取MFCC系数【J】.中国人民公安大学学报.2008 【3】杨洪辰. 声纹识别特征MFCC提取方法研究【J】.中国人民公安大学学报.2005 【4】柳春. 语音合成技术研究【J】.西北工业大学学报. 2008 【5】赵博. MATLAB 在语音分析中的应用【J】.计算机系统应用.2005 【7】蔡莲红. 用于语音合成的PSOLA算法简介【 J 】.微型计算机.1996 【6】Kiyohiro SHIKANO. CROSS-LANGUAGE VOICE CONVERSION【J】. Waseda University,JAPAN. 2009 ;

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档