带有SpeechSense算法AGC在音频系统中应用.docVIP

带有SpeechSense算法AGC在音频系统中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
带有SpeechSense算法AGC在音频系统中应用

带有SpeechSense算法AGC在音频系统中应用   [摘要] 自动增益控制(简称为“AGC”)可以在信号的输出端提供稳定增益,而不受输入端增益不同的影响。本文主要阐述了AGC的工作原理以及在音频系统中的具体应用。   一直以来,传统的AGC在应用中存在一个严重的技术缺陷,即:当环境噪声大于所设定的阈值并且讲话者停止讲话时,AGC会自动将环境噪声放大至所需电平,此时在系统中会出现极大的噪声。如果我们将阈值提高又会出现讲话声音小的人无法正常启动AGC。Biamp开发了一种叫做“SpeechSense(人声辨识)”的算法,可以智能化地创建阈值和提供可选的“语言模式”,此功能限制了AGC只有在识别到人声的时候才对信号进行AGC处理,从而彻底消除AGC误启动的问题。在本文中,将会详细介绍SpeechSense算法的工作原理以及在音频系统中的具体应用和系统调试中的注意事项。   什么是AGC?   AGC是英文“Automatic Gain Control”(自动增益控制)的缩写。AGC在各个行业中的应用非常广泛。在模拟电路时代,AGC的控制精度和速率是由模拟电路的设计和电子元件的精度所决定的,我们称之为AGC的工作特性。   大家都知道,现在的音频处理核心产品大都采用DSP芯片进行设计,因此我们将之统称为音频DSP处理器。实际上,与以往的模拟AGC电路不同,DSP处理器的电路设计大同小异,所采用的芯片也大都雷同。而所有的DSP处理器所支持的功能,如:滤波器、分频器、路由器、混音器、AGC等等都是由“算法”来实现的。因此,AGC的工作特性完全取决于AGC算法。   为什么音频系统需要AGC?   在实际的音频会议系统应用中,经常会出现以下这些情况:   由于性别的原因或讲话者的各自习惯不同,有的人声音大些,有的人声音小些,有的人喜欢离话筒远些,有的人喜欢离话筒近些,这些情况会导致在音频系统输出端的音量幅度产生巨大的差别。   AGC可以针对上述这些情况自动给与“增益补偿”。通俗一点的讲,当讲话者的声音太大的时候,AGC会自动降低增益,从而使会议的扩声维持在一个恒定的音量上;反之,讲话者的声音太小,AGC会自动提高增益,以确保系统仍然维持在恒定的音量。在音频系统中,AGC可以根据“要求”对声音信号自动给予“增益补偿”。因此通常用于调节各种会议系统的不同讲话者的声音音量平衡。   传统AGC是如何解决这些问题的呢?   首先,我们先来学习几个技术名词:   ?Level源信号电平:讲话者的声音经话筒拾音,进入音频处理器的原始电平;   ?Min Threshold最小电平阈值:启动AGC的最小电平值;   ?Target Level目标电平:我们所需要的,经过AGC自动调整的电平。当输入电平大于所设定的Min Threshold,AGC会启动并自动根据所设定的Target Level对源信号进行增益补偿,并保持输入信号为恒定的Target Level。   当源信号电平大于最小电平阈值(Min Threshold)但小于目标电平(Target LeveI)时,AGC启动并对源信号自动提高增益至目标电平(Target Level)。如图一所示:   红色代表经AGC调整后的电平曲线,蓝色代表未经AGC调整的源信号电平曲线。当源信号电平小于最小电平阈值(Min Threshold).AGC关闭,从而防止AGC将噪声电平放大输出。见图二:   当源信号电平大于最小电平阈值(Min Threshold),并大于目标电平(Target Level)时,AGC启动并自动衰减输入信号增益至目标电平(Target Level)。从而实现对输入信号的自动增益控制,并且在输出端维持一个相对恒定的音量。见图三:   传统AGC在实际应用中的问题   上文中我们提到,当源信号大于所设定的Min Threshold,AGC不工作。其目的是避免AGC电路错误地提升系统的噪声信号。只有在源信号大于某一设定值时,我们才认为此信号为有用信号并对此信号进行AGC平衡电平。   这种设计方案看似非常合理,但在实际工作中却屡屡出错。比如:我们所用的所有语音通信软件(如:QQ、Skype、Lync等等)都支持AGC,但在实际使用中经常出现的问题是,当两端的人都不讲话的时候,可以非常明显地感觉到对方的噪声的提升。   究其原因,在实际工作环境中,噪声的值实际上很难预测,它与有用信号之间有很大的重叠区域,但我们给定一个MinThreshold的时候,不是当有用信号非常低时AGC没有启动,就是噪声信号高于Min Threshold,AGC错误的启动。   因此,在很长的一段时间,业内都没有一个彻底的解决方案。带有SpeechSense(人

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档