一种基于谱熵的语音端点检测方法.docVIP

下载本文档

183
0
约2.01千字
约 4页
2016-12-11 发布于北京
举报
版权申诉

一种基于谱熵的语音端点检测方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种基于谱熵的语音端点检测方法在低信噪比环境下，为了提高语音端点检测的效果，提出了一种适应于低信噪比环境的语音端点检测方法。基于子带谱熵法，引入正参数对基本的谱熵法进行算法改进，得到改进后的子带谱熵法，通过增加预判环节选择合适的正参数，加大语音信号与噪声信号的区分度，进一步改善在低信噪比环境下算法的效果，得到新的语音端点检测算法。仿真实验表明，新的算法不仅快速高效，具有较强鲁棒性，而且适合在低信噪比环境中较准确的检测出语音端点。【关键词】语音端点检测子带谱熵参数可变鲁棒性1 引言随着语音识别、语音增强等技术的飞速发展，端点检测越来越重要。端点检测的目的是在复杂环境下识别出噪音信号与语音、噪音混合信号，确定语音信号的开始与结束端点，以便进一步的语音信号处理。在助听器、手机等硬件环境下，由于实时性与准确性要求较高，计算量即不能过大以免硬件不能满足要求，又要求语音信号处理快速、准确。准确的端点检测可以大幅度减少计算量，提高系统的语音处理效率。现阶段运用的端点检测算法有短时能量与短时过零率双门限法、自相关函数法、方差法、谱距离法、能零比与能熵比等。在噪音环境下这些方法的效果并不是很理想，语音信号的能量并不大，所以单纯用能量参数并不能很好的将语音信号检测出来。Shen提出了一种基于信息熵的端点检测方法，信息熵只与语音信号的统计学特性有关，与单纯的能量幅值大小无关，所以这种方法能够较好地将语音信号与噪音信号检测出来，并且计算量不大，适用于助听器、手机等硬件环境。但是对于周期性能量较为集中的噪音而言，误判率较高。为了消除每帧信号FFT变换后的谱线幅值受噪音影响，把每条谱线的谱熵值改为子带的谱熵，从而改善在周期性噪音环境中端点检测的效果。为提高在低信噪比环境下端点检测的效果，在谱熵计算中引入一个正常量K。经过实验证明这种方法确实比一般方法正确率要高，但是随着信噪比不断降低，端点检测误判率又会不断提高，单纯的运用加入正常量的子带谱熵法还是不能适用于噪声较严重的场合。针对上述情况，本文提出了一种自适应正常量可变的谱熵端点检测改进算法。这种方法基于子带谱熵法，引入一个可变的正数K，计算信号谱熵。基于最大离散谱熵定理，通过正数K的调节，增大有语音信号帧与无语音信号帧谱熵值的差距，增强语音与噪音的区分度，使算法在低信噪比环境下也能有效的进行。2 端点检测算法2.1 谱熵法2.5 实验仿真结果改进算法后在MATLAB中进行仿真，新算法的效果经实验验证要好于改进前的算法，如图4所示，在低信噪比为-5DB时，算法也有比较好的效果。为了说明一般性，录制男女各10人，样率为8000HZ、16bit量化的纯净语音信号，分别叠加白噪声、工厂噪声对比改进前与改进后算法的效果见表1与表2 ，实验证明新算法的误判率较低，端点检测效果较好。3 小结本文提出了一种可以根据环境噪声选择参数的子带谱熵端点检测算法，即改进了可引入常数的谱熵法，得到一种抗噪能力较强的子带谱熵法，并通过仿真实验证明与之前的算法相比在低信噪比环境中检测效果更好。参考文献[1]杨行峻，迟惠生.语音信号数字处理[M]. 北京：电子工业出版社，1995.[2]卢艳玲.一种基于多特征的带噪语音信号端点检测与音节分割算法[J].电声技术，2005（07）：60-62.[3]孙炯宁，傅德胜，徐永华.基于熵和能量的语音端点检测算法[J].计算机工程与设计，2005，26（12）：3429-3431.[4]张徽强.带噪语音信号的端点检测和声韵分离[D].国防科学技术大学，2005.[5]Shen J，Hung J，Lee L.Robust Entropy-based Endpoint Detection for Speech Recognition in Noisy Environments[C]//Proceeding of International Conference on Spoken Language Processing. Sydney：[s，n]，1998：232-238.[6]王琳，李成荣.一种基于自适应谱熵的端点检测改进方法[J].计算机仿真，2010，27（12）：373-375.[7] Chuan Jia，Bo Xu.An Improved Entropy- Based Endpoint Detec-tion Algorithm [C].ISCSLP，2002，285-288.作者简介李战明（1962-），教授、博导，兰州理工大学电气工程与信息工程学院学院院长。主要研究方向为复杂系统的建模与控制，神经模糊系统与软计算，智能信息处理与模式识别，计算机控制系统的理论与工程等。尚丰（1990-），男，甘肃甘南州合作市人。硕士学位。研究方向为信号与信息处理。作者单位兰州理工大学甘肃省兰州市 73