语音端点检测方法的的研究.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音端点检测方法研究1 沈红丽,曾毓敏,李平,王鹏 南京师范大学物理科学与技术学院,南京(210097 ) E-mail :orange.2009@163.com 摘 要: 端点检测是语音识别中的一个重要环节。有效的端点检测技术不仅能减少系统的处 理时间,增强系统处理的实时性,而且能排除无声段的噪声干扰,增强后续过程的识别性。可以 说,语音信号的端点检测至今天为止仍是有待进一步深入的研究课题.鉴于此,本文介绍了语 音端点算法的基本研究现状,接着讨论并比较了语音信号端点检测的方法,分析了各种方法的 原理及优缺点,如经典的基于短时能量和过零率的检测方法,基于频带方差的检测方法,基于 熵的检测方法,基于倒谱距离的检测方法等.并基于这些方法的分析,对端点检测方法做了进 行了总结和展望,对语音信号的端点检测的进一步研究具有深远的意义。 关键词:语音信号;端点检测;噪声 中图分类号:TP206. 1 1. 引言 语音信号处理中的端点检测技术,是指从包含语音的一段信号中确定出语音信号的起始 点及结束点。语音信号的端点检测是进行其它语音信号处理(如语音识别、讲话人识别等)重 要且关键的第一步. 研究表明[1],即使在安静的环境中,语音识别系统一半以上的识别错误来 自端点检测器。因此,作为语音识别系统的第一步,端点检测的关键性不容忽视,尤其是噪声环 境下语音的端点检测,它的准确性很大程度上直接影响着后续的工作能否有效进行。 确定语音信号的起止点, 从而减小语音信号处理过程中的计算量, 是众多语音信号处理 领域中一个基本而且重要的问题。有效的端点检测技术不仅能减少系统的处理时间,增强系 统处理的实时性,而且能排除无声段的噪声干扰,增强后续过程的识别性。可以说,语音信号的 端点检测至今天为止仍是有待进一步深入的研究课题。 2. 语音端点检测主要方法和分析 在很长一段时间里,语音端点检测算法主要是依据语音信号的时域特性[2].其采用的主 要参数有短时能量、短时平均过零率等,即通常说的基于能量的端点检测方法。这些算法在 实验室环境下具有良好的性能,但在噪声环境下,则无法达到其应有的效果。近年来,随着通信 业的迅猛发展,又出现了很多的语音端点检测算法。它们主要是通过采用各种新的特征参数, 以提高算法的抗噪声性能。如基于倒谱系数[3]、频带方差[4]、自相关相似距离[5] 、信息熵 [6]等也逐渐的被应用到端点检测中。有时,还通过将信号的几种特征组合成为一个新的特征 参数来进行端点检测。 2.1基于短时能量和短时平均过零率的检测方法 该方法也称为双门限比较法,它是在短时能量检测方法的基础上,加上短时平均过零率, 利用能量和过零率作为特征来进行检测.在信噪比不是很低的情况下,根据语音信号的能量大 于噪声噪声能量的假设,通过比较输入信号的能量与语音能量阈值的大小,可以对语音段和非 语音段加以区分[7].输入每帧信号的能量可由下式得到[7-8]: 1本课题得到江苏省普通高校自然科学研究计划资助项目(项目批准号:07KJD510110 )的资助。 - 1 - N −1 Ej ∑x2 (i ) (1) i 0 Ej j x (i) N j 式中, 表示第 帧的能量, 为输入的信号, 为帧长.如果第 帧信号的短时信 号能量E 大于设定的阈值,就判断当前帧为语音帧,否则判为静音帧.短时过零率的计算可由 j 下式得到:[8] N Zn ∑| sgn[x (n )]=−sgn[x (n −1)]| (2)

您可能关注的文档

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档