基于短时自相关函数的基因周期检测讲解PPT概要.pptx

基于短时自相关函数的基因周期检测讲解PPT概要.pptx

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于短时自相关函数的基因周期检测讲解PPT概要

基音周期的检测 什么是基音周期检测 人在发音时,根据声带是否震动可以将语音信号分为清音跟浊音两种。浊音又称有声语言,携带者语言中大部分的能量,浊音在时域上呈现出明显的周期性;而清音类似于白噪声,没有明显的周期性。发浊音时,气流通过声门使声带产生张弛震荡式振动,产生准周期的激励脉冲串。这种声带振动的频率称为基音频率,相应的周期就成为基音周期。? 通常,基音频率与个人声带的长短、薄厚、韧性、劲度和发音习惯等有关系,在很大程度上反应了个人的特征。此外,基音频率还跟随着人的性别、年龄不同而有所不同。一般来说,男性说话者的基音频率较低,大部分在70~200Hz的范围内,而女性说话者和小孩的基音频率相对较高,在200~450Hz之间。? 目前,基音检测的算法有很多种,常用的检测算法有自相关法、平均幅度差函数法、并行处理法、倒谱法、简化逆滤波法等。 本次基音周期的检测,我们选用的是短时自相关函数法,包括四个模块。 第一个模块为基音的端点检测,主要为了区分浊音和清音。第二个模块为基音检测中的带通滤波器,主要为了减少共振峰的干扰。第三个模块为短时自相关函数法做基音检测,主要为了计算出基音周期。第四个模块为平滑处理,主要为了消除偏离值点。 基音周期的检测(端点检测) 1.设计数据文件 名称:audioread 功能:读入以.wav为扩展名的音频文件。 调用格式:[ y , fs , nbits ] = audioread ( wavFilename ) 说明:输出参数Y是数字化的音频;fs是信号采样频率;nbits是每个样点在编码时的二进制位数。 2.分帧处理 先定义一个帧数*帧长的数组,然后计算帧 的偏移量来,按语音数据的位置把x放入y中。 名称:enframe 功能:把语音信号按帧长和帧移进行分帧 调用格式:f = enframe ( x , win ,inc ) 3.端点检测 名称:pitch_vad1 功能:用能熵比法进行端点检测。 说明:输入参数y是分帧后的数组,一般是一列表示一帧数据;fn是信号的总帧数;T1是一个阈值;输出参数voiceseg是语音端点的信息;vosl是几个有话段,当该帧为有话段时SF=1;否则为0,Ef是能熵比值。 pitch_vad1 for i=1:fn Sp = abs(fft(y(:,i))); % FFT取幅值(:表示所有 y(:,1)表示第一列) Sp = Sp(1:wlen/2+1); % 只取正频率部分 Esum(i) = sum(Sp.*Sp); % 计算能量值 (能量放入Esum里) prob = Sp/(sum(Sp)); % 计算概率 H(i) = -sum(prob.*log(prob+eps)); % 求谱熵值(eps表示很小的数,避免为零)(谱熵放入H里) end 谱熵值很类似与过零率值,在有话段内的谱熵值小于噪声段的谱熵值,所以如同能零比一样,用能熵比更能突出噪声段的差别。 基音周期的检测(基音检测中的带通滤波器) 什么是带通滤波器 带通滤波器(band-pass filter)是一个允许特定频段的波通过同时屏蔽其他频段的滤波器。 带通滤波器的作用 在使用相关法和AMDF法的基音检测之前常用到低通滤波器和带通滤波器,其主要目的是减少共振峰的干扰。我用了500Hz作为滤波器的上限频率,选择截止频率高不利于减少噪声和共振峰的影响。所以在本次的基音检测中的预滤波器选择的带宽为60~500Hz,高频截止频率选择500Hz,是因为基频区间的高端就在这个区域中,低频截止频率选择60Hz是为了减少工频和低频噪声的干扰。 什么是共振峰 共振峰是指在声音的频谱中能量相对集中的一些区域,共振峰不但是音质的决定因素,而且反映了声道(共振腔)的物理特征。 声音在经过共振腔时,受到腔体的滤波作用,使得频域中不同频率的能量重新分配,一部分因为共振腔的共振作用得到强化,另一部分则受到衰减。由于能量分布不均匀,强的部分犹如山峰一般,故而称之为共振峰。 为什么要减小共振峰 声道特性与基音周期估计有关,会对基音周期检测造成一定干扰。从语音信号中去除声道的影响,直接取出仅与声带振动有关的声源信息并非易事。声道共振峰可能强烈改变声门波形的结构,从而严重影响激励信号的谐波结构,给基因检测造成困难。 我选用IIR滤波器中的椭圆滤波器,因为IIR滤波器的运算量比FIR少,当然IIR滤波器会带来延迟,也就是相位的变化,但语音信号是对相位不敏感的信号;又选用椭圆滤波器,因为它在经典滤波器设计中相同过渡带和带宽条件下,需要的阶数比较

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档