低信噪比环境下语音端点检测方法研究计算机科学与技术专业论文.docxVIP

下载本文档

18
0
约6.05万字
约 73页
2019-01-30 发布于上海
举报
版权申诉

低信噪比环境下语音端点检测方法研究计算机科学与技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

低信噪比环境下语音端点检测方法研究计算机科学与技术专业论文

低信噪比环境下语青端点检测方法研究摘低信噪比环境下语青端点检测方法研究摘要语音端点检测的任务是从带噪语音信号中分辨出语音段和非语音段，广泛应用在语音增强、语音编码和语音识别等语音通信领域。有效的检测出语音信号的端点，不仅可以减少语音信号处理的运算量，而且可以有效的提高系统的性能。目前，现有的端点检测方法在高信噪比环境下具有很好的检测效果，但是随着噪声的增强，其检测性能都有很大程度的下降，有些方法因此而失效，因此研究低信噪比环境下的语音端点检测方法意义重大。首先介绍了语音信号预处理方法，包括预滤波和采样、预加重、分帧和加窗。然后按照时域特征、频域特征、非线性特征、多特征结合的顺序介绍了常见语音端点检测方法，给出了各种方法的数学模型、实验与分析，为低信噪比下语音端点检测方法的改进提供理论基础。在多特征结合以及非线性特征方面，提出四种新的语音端点检测方法： (1)鉴于能量谱熵特征结合了时域能量与频域谱熵的优点，将非线性动力学的统计复杂度特征应用到语音端点检测中，并将其与能量特征相结合，提出能量统计复杂度的语音端点检测方法。 (2)由于近似熵的值与数据长度有关以及一致性差的缺点，而样本熵是近似熵的改进算法，比近似熵具有更好的性质，因此提出基于样本熵的语音端点检测方法。 (3)复杂运动一般由规则运动和随机运动混合而成，C0复杂度则为随机运动在复杂运动中所占的比例。传统Co复杂度的计算基于傅立叶分析，由于傅立叶分析只能区分信号在频域内的差别，不能很有效地分析非平稳信号，而小波分析能同时利用信号与噪声在时域和频域的差别，因此提出基于小波变换Co复杂度的语音端点检测方法。 (4)传统的Lempel．Ziv复杂度分析基于二值粗粒化方法，由于二值粗粒化方法可能会丢失动力学系统的一些重要信息，因此采用多值粗粒化方法重构时间序列，提出基于多值粗粒化Lempel．Ziv复杂度特征的语音端点检测方法。此外，采用模糊C均值聚类算法和贝叶斯信息准则算法进行特征门限估计，并使用双门限法进行端点检测。在TIMIT连续语音库上的实验表明，在低信噪比环境下，四种改进方法的检测性能要优于其原有基准方法，且各自的算法时间复杂度等同于原有基准方法。关键词：语音端点检测；能量统计复杂度；样本熵；小波变换；Co复杂度；多值粗粒化；Lempel．Ziv复杂度 Ⅱ 硕1：学位论文Abstract 硕1：学位论文 Abstract Voice activity detection(VAD)is a scheme to classify a speech signal into speech and non—speech segments and has been widely used in speech communication systems， such as speech enhancement，speech coding，and speech recognition．Effective VAD of speech signals can not only reduce the amount of speech signal processing operations，but also improve system performance significantly．At present，current VAD methods have good detection performance in high SNR environments，but as the speech background noise increasing，its performance declines sharply，and some of these methods become invalid，SO it is critical to carry the research of VAD in low SNR environments． Firstly，the speech signal preprocessing methods are described，including pre—filtering and sampling，pre-emphasis，framing and windowing．Then，the common VAD methods are introduced in the order of the time-domain characteristic，frequency domain characteristic，nonlinear characteristic and multi—feature integr