男女声识别系统-Read.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
男女声识别系统-Read

男女声识别系统 摘 要: 本文通过对男性和女性声音的语音特征的研究,发现男女声的基音频率存在较大的差异,并设计了基于基音频率分析的男女声识别系统。男女声识别系统由以下三个模块电路构成:话筒放大器,低通滤波器,半波整流电路,单片机测量控制模块。话筒放大器采用NE5532P音前置芯片,对语音信号进行放大;八阶低通滤波器MAX293完成基音信号的提取;单片机STC12C5410AD实现频率测量和控制输出功能。经仿真与电路实测,男女声的识别效果良好。 关键词:男女声识别、基音频率、低通滤波器、单片机。 一、引言 人类基音的范围约为70~350Hz左右,由于生理结构的不同,男性与女性的声音呈现出不同的听觉特征,男声的基音频率大都在100—200HZ之间,而女声则在200—350HZ之间;在会话中,同一发音者的基音频率变化的统计结果,如图一所示。女声与男声相比,前者的平均值、标准差都为后者的两倍左右。不同发音者的基音频率分布如图二所示,在对数频率轴上男声,女声分别呈现正态分布,男声的基音频率的平均值和标准差分别为125HZ及其20HZ。女声约为男声的2倍。鉴于男女声存在基音频率的明显差异,基音频率可作为男女声识别的依据。 二、方案论证与比较 基于男女声基音频率的差异,男女声识别的实现可以通过基音频率的测量来实现。基音频率的实现有多种方法。如FFT分析、自相关分析等。 方案一:基于FFT的短时频谱分析。把语音信号数字化,即经AD采样量化之后,用FFT算法处理,得到信号的频谱,从而获得基音频率。这种方法由于算法较复杂,数据处理量大,如用单片机来实现,编程复杂,运算速度慢,难以满足实时要求。 方案二:滤波器基音提取技术。利用低通滤波器滤除多次谐波及共振峰等高频成分,得到近似的基音信号,此法可以用硬件电路构成滤波器实现基音信号的粗略提取,避免了大量算法分析和数据处理,实现起来相当简单。为了证明这种方法的有效性, 我们用计算机声卡录制了近20名男女同学的单音、词组和句子的WAV文件,在MATLAB上编写程序进行仿真。 1.男女声信号通过400HZ低通滤波后的仿真波形比较。我们将男女声信号经过八阶低通滤波器,其截止频率设定为400HZ。仿真结果如图三所示。从图形上我们可以看到:通过400HZ的低通滤波器后,男声输出为约120HZ左右周期性信号(非单频正弦波);女声输出约250HZ左右周期性信号,其波形接近正弦波。这说明经过400HZ低通滤波器后,女声声音主要由基音信号构成,而男性声音的非正弦性是由于其二次谐波及共振峰的存在的结果。 2.男女声信号通过200HZ低通滤波后的仿真波形比较。我们将男声、女声输入信号经过八阶低通数字滤波器滤波,截止频率设定为200HZ。男声、女声及其通过200HZ低通滤波后的波形如图四所示: 从上边的图形我们看出:经过200HZ的低通滤波器,男声输出为较好的正弦波(基音信号),而女声基本上没有信号通过。 从MATLAB数据处理软件对采集信号分析的结果表明,用滤波器提取基音频率的方法完全可行。我们在计算机上用这种方法编写了男女声识别软件,对男女声基音特征进行提取,实现了识别的仿真。实验表明,在正常说话条件下,系统具有较高的识别率,仿真效果令人满意。 三、系统实现 1.设计思想与系统构成: 话筒产生的语音信号很微弱,大约50mV左右,必须经过放大才能送往后级电路处理。两个高阶低通滤波器分别工作在400HZ的截止频率和200HZ截止频率。这主要是为了保证始终有一路信号是含谐波分量较少的近似基音信号。整形电路把正弦波转化为矩形脉冲,送往单片机STC12C5010AD测量其周期。单片机完成多次测量后,进行统计,作出男声还是女声的判断,送输出显示。 2.主要电路的设计与说明 A、话筒放大电路 通过用NE5532P芯片来实现语音放大,把微弱的语音信号放大的50倍左右。 如图所示,采用运算放大器作音频前置放大电路。其优点是体积小、功耗小、一致性较好。 B、低通滤波电路 采用MAX293可控截止频率8阶巴特沃夫低通滤波器,如图所示,则电路结构简单,外围元件少,截止频率可由外部时钟控制或由时钟输入端所接电容决定。截止频率控制简单,且滤波效果好。调试时,由外部时钟控制截止频率,调试完成后,可将滤波器的截止频率固定,即在时钟输入端(CLK)接一个一定大小的电容。 比较两个方案,方案二实现滤波简单方便,满足系统要求。 C、全整流电路 如图所示,U5A、U6A各组成一线性半波整流电路,而U5B、U6B各组成一加法电路。U5A和U5B,U6A和U6B构成一线性全波整流电路。 D、单片机电路 把经过整流后的两路频率信号输入STC12C5410AD进行A\D转换并采样。再各求出两组采样好的数据的能量,以便来进行比较。若求出来的

文档评论(0)

busuanzi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档