几种不同基频提取算法的比较研究.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
几种不同基频提取算法的比较研究

几种不同基频提取算法的比较研究 第31卷总第8O期 2010年12月 西北民族大学(自然科学版) JournalofN0rthwtUniversityforNationalities(NaturalScience) Vo1.31,No.4 Dec,2010 几种不同基频提取算法的比较研究 ,涛—瓢虑拳 马海隆,高璐,于洪志 (西北民族大学中国民族信息技术研究院,甘肃兰州730030) [摘要】基频提取算法一直是语音信号处理领域的研究热点,文章将当前的多种基频提取算法分为时域,频域以 及时频混合三个方面,并分别对其中的A.MDF算法,线性预测残差倒谱算法以及小波变换的基频提取算法进行了比较 研究,对三种算法分别在如何准确判定语音波形的谷值点,语音信号突变以及语音的消噪等不同的语音信号处理角度进 行了阐述,并在分析其优缺点后,提出将多种基频检测方法结合能更好地促进基音周期检测的准确性. [关键词]基频提取;AJF;倒谱;线性预测残差;?1-波变换 [中图分类号】TP391;H214[文献标识码]A[文章编号]1009—2102(2010}04—0059一O5 0引言 所谓基音就是指发浊音时声带振动的周期性,其倒数称之为基音频率,简称基频.基频是语音信号 处理中非常重要的参数之一,一个好的基频提取算法对于高质量的语音合成,语音识别等语音信号处理 方面的研究都具有十分重要的意义….同时,声音三要素中的音高大小也取决于声音基频的高低,基音 的变化模式成为声调,因此,基频提取算法对于语言的声调研究也是较为重要的一项工作.但基频提取 算法也存在一定的困难,主要包括:①声门激励信号并不是一个完全的周期序列.语音的头,尾部并不 具有声带振动那样的周期性,特别是清音和浊音之间的过渡帧很难判断它们是否是周期性的.②很难 从语音信号中去除声道的影响直接取出仅和声带振动有关的激励信号.③由于语音信号本身是准周期 性的,在浊音段很难精确地确定每个基音周期的起止位置,同时,波形的峰,过零也受到共振峰结构和噪 声等的影响.④基音周期变化范围大,给基音检测带来一定的困难j. 自20世纪60年代以来,人们已经提出了许多经典的基频提取的算法,大致可以分为三类:①时域 分析算法,如自相关法(AcF),短时平均幅度差法(AMDF)等.②频域分析算法,如倒谱法(Cl弹)等.③ 时频结合的分析算法,如小波分析算法等.随着现代信息处理方法的发展,基频提取算法也在不断的改 进,在研究过程中发现,这些算法都具有不同的优缺点,文章对时域中的AMDF算法,频域中的倒谱法 以及小波分析法分别进行阐述,比较研究,以便能够全面地掌握基频提取算法的性能,为今后的研究打 下良好的基础. 1短时平均幅度差算法 短时平均幅度差算法是时域算法的一种,相比于频域法和时频混合法来说,时域法提取基音周期的 算法简单,计算量小. 自相关算法是时域算法中较早提出的一种算法,但这种方法的复杂度是随信号的采样率的提高成 平方增加的,而人们为了提高精度增大采样率,因此算法的实现需要较高的硬件支持,同时,当基频超过 [收稿日期】2010—10—22 [作者简介】马海隆(1977一),男(回族),甘肃临夏人,主要从事中文信息处理研究 一 59— 帧长一半时,自相关法的精度会下降.本文主要针对时域法中的另一种算法——短时平均幅度差 (AMDF)算法进行相关阐述. 1.1算法描述 为了避免短时自相关函数的乘法运算,研究人员采用了一个简单方法就是利用差值,因此,产生了 短时AMDF. N一1-kI (k)=}(m)一(m+k)l m=0 显然,在上式中,F(是)的计算只需要加减法和绝对值的运算,运算量远远小于自相关法.为了避 免由于k值变化过大而引起的判断结果不准确,研究人员对上式进行了改进,产生了变长度的AMDF (LV~AMDF). 通过对浊音的LV—AMDF的分析可以发现,对于一般的平稳性不好的浊音段语音,在它的短时周 期谷值特性中,除起始零点外,第一周期谷点大多就是全局最低谷点,因此,这时以全局最低谷点作为基 音周期计算点,一般不会发生检测错误.但对于周期性和平稳性都较好的浊音语音段来说,Lv— AMDF的方法常会出现的第一周期谷点并不是全局最低谷点,最低谷值点也不一定是基音周期所在 点,在这种情况下,若以全局最低谷点作为基音周期计算点就会产生严重的检测错误【引. 本文所阐述的是一种改进的AMDF方法,它通过预测谷值范围,循环AMDF和线性变换三步骤的 有效组合,解决了上述的问题,实现了精确的基音检测. 1.2算法实现 1.2.1预判谷值范围 为了避免上述谷值点的判断错误,先对AMDF的所有波谷做一个预检测,找到最小谷值所在点N (N为抽样点的标记)和最小谷值的大小arIl根据最小谷值的大小确定门限值,一般B和0t

文档评论(0)

weizhent2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档