- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE \* MERGEFORMAT 5
一种复杂噪声环境下的语音端点检测方法
熊威,郑建立
(东华大学信息学院,上海 201620)
摘要:噪声环境下的语音端点检测在语音识别系统中占有十分重要的位置。为了提高端点检测的鲁棒性和实时性,本文提出了一种延迟分割策略:以能频比为特征参数确定粗端点,并在此基础上使用排列熵算法确定精确端点,以精确端点为起始点分割语音信号,对所得到的语音片段信号按照分类标准消除噪声信号带来的错误分割。在TIMIT连续语音库与NOISEX-92标准噪声库上的实验表明,文中提出的方法比基于常规的基于零能与谱熵的方法有更好的检测效果,特别是在低信噪比的情况下,效果尤为突出。同时由于排列熵算法的简单易实现,算法的实时性表现非常好,能够为嵌入式移动通信设备提供精确快速的语音端点检测技术。
关键词: 语音端点检测;延迟策略;排列熵;分类标准;能频比;
中图分类号:TP302 文献标识码:B
A Robust Algorithm for Detection of Speech
Endpoint in Noisy Environment
XIONG wei, ZHENG Jian-li
(College of Information and Technology, Donghua University, Shanghai 201620, China)
ABSTRACT:Accurate Speech endpoint detection in adverse environments is very important for robust speech recognition. To improve the noise robustness and real-time performance of endpoint detection, this paper proposes a delay strategy using energy frequency ratio to find a coarse endpoint and using permutation entropy to locate the precise endpoint. And then use classification criteria to eliminate the incorrect results. The results of experiment based on the TIMIT and NOISEX-92 database show that the proposed algorithm can locate the endpoint more accurate and quicker than the traditional method.
KEYWORDS:Speech endpoint detection; Delay strategy ;Permutation entropy; Classification criterion; Energy frequency ratio;
1 引言
语音端点检测的目的是要在较大信噪比的环境下能够准确地区分语音和非语音信号,确定其起始点,它在语音信号的处理中起着关键作用。语音处理系统的工作环境是不同的,因此检测算法必须能够稳定的工作在不同的噪声下,这对算法的鲁棒性要求非常高。同时在实际应用系统中,如果算法的实时性较差,再加上后续的计算时间,会给用户一种系统反应迟钝的感觉,因此对检测算法的实时性也有很高的要求。在过去的几十年中,研究人员对语音端点检测所采取的策略主要有两种: = 1 \* GB3 ①实时策略:选择常用的特征参数如过零率、短时能量、信息熵或者其它基于这些基础特征参数的做一些新的变化而得到的新的特殊特征参数,逐帧扫描,满足预设条件的帧就是所要找的端点。 = 2 \* GB3 ②延迟策略:首先检测一个粗端点,然后再从粗端点向前或者向后回溯,直到确定最终精确的端点。这两种策略在安静的环境下,所确认的端点精度相差不大,但相比较于实时性策略延迟策略的实时性比较差。因此在安静的环境下语音识别系统倾向于选择实时策略。在噪声环境下,尽管延迟策略的实时性仍然没有改善,但是其鲁棒性较好,检测的精度比实时性策略要好很多。在没有其它的辅助改善措施的情况下,实时策略容易受各种冲击噪声的干扰,导致虚报端点或端点位置偏差,甚至端点检测失败。
近些年来研究人员提出一些改进的算法来改善端点检测的鲁棒性:如谱熵法、神经网络建模、模糊理论等。这些算法在一定的程度改善了端点检测性能,但都对噪声做了某些假设,对于实际环境的适应性较弱,实时性不强,实现
您可能关注的文档
最近下载
- 电梯安装工程监理实施细则难点.doc
- 电梯安装监检过程中重点难点分析.pdf
- 卢中南钢笔楷书字帖-初中必背古诗文。精品资料.doc
- 电梯安装工程监理实施细则解决方案.doc
- 肺栓塞幻灯PPT课件.pptx VIP
- 追觅Dreame Bot L10s Ultra Self-Cleaning and Auto-Empty Robot Vacuum and Mop User Manual说明书用户手册.pdf VIP
- 2025年党支部书记学习教育专题党课中央八项规定专题党课讲稿(严守中央八项规定精神,争做新时代合格党员;从中央八项规定精神看党员干部的责任与担当).docx VIP
- JT∕T 1447-2022 营运车辆低速驾驶辅助系统性能要求和测试规程.pdf
- 追觅Dreame L10s Ultra Robot Vacuum and Mop User Manual-NL说明书用户手册.pdf
- 2022届Free高考英语词汇班笔记.docx
文档评论(0)