声音识别模型资料.docVIP

下载本文档

7
0
约3.01万字
约 36页
2016-08-30 发布于湖北
举报
版权申诉

声音识别模型资料.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

??声音识别模型的建立与评价摘要本文选取合适声音特征参数设计一个声音识别模型，并给出了具体的建立方案，然后还要对建立的模型进行优化提高识别准确度。对于问题一,首先对声音信号进行了试听，然后利用Matlab绘制了声音波形如图一、图二所示，通过两类声音进行比较和分析。得出两类声音如下区别：非正开门声的幅值明显比正常高，说明非正常开门声响声大，而且非正常声音持续的时间远比正常的要长。对于问题二，首先对声音信号的短时平均能量和短时过零率这两个时域特征进行分析如图三和图四所示。然后对倒谱系数（）这一频域特征进行了分析如图八所示，并且通过倒谱系数（）建立了一个13维的特征向量如附件一所示。对于问题三，利用上一问中提取的倒谱系数这一重要特征，经过训练后，建立了基于和声音识别模型如图九所示，然后随机选取一段声音信号进行测试，测试结果如图十一所示，从图中可以看出此模型能够区分正常与非正常声音。对于问题四，我们利用主成分分析法建立了特征向量优化模型如式33所示，得出声音的两个主要特征是短时平均能量和，然后在上面的声音识别模型中加入了短时平均能量这一时域特征向量，最后对优化后的声音识别模型进行检验，发现优化后的模型识别准确率有了进一步的提高。对于问题五，首先按照题目的要求，利用Matlab中的随机函数产生一个噪声加入到声音信号中，得到了加噪后的声音时域和频域的波形图如图十三和图十四所示。然后设计了基于双线性变换法的Butterworth滤波器模型，通过此滤波器模型对加噪后的声音进行滤波，得到的时域和频域波形图如图十五和图十六所示。比较滤波前后可以看出噪声基本能被过滤掉，设计的Butterworth滤波器有明显的的滤波效果。本文综合考虑了各个方面，建立了符合条件的声音识别模型，采用Matlab编程的方法，求得的结果完全满足题目的要求，并有一定的实际应用价值。关键词: 倒谱系数主成分分析法 Butterworth滤波器问题重述随着科技的发展，人类步入了家居智能化的新时代。智能冰箱、智能清洁机器人、智能电视等已步平常百姓家但智能化的防盗门处于研发阶段，。随着人们对家居安全意识的不断增强，对防盗、防抢和防砸的门禁系统的智能性提出更高的要求。基于此，对正常和非正常开门（指盗窃开门等声音）的声音进行识别是智能防盗门的关键问题和技术，其具有广泛的应用前景和实用价值。为了进行声音识别模型的建立，我们采集到了正常和非正常开门的声音，各40次开门声音数据。该数据可利用Matlab的load函数载入到计算机内存，内存中变量有和等变量，其中为采频率为采数据。这些数据利用Matlab中的sound函数，，利用plot函数绘制出具体的声音波形图，利用合适的时域或（和）频域特征表达个声音信号，建立特征向量，写出提取特征向量的具体方法和程序代码。建立声音识别模型（二分类模型），利用模型区分正常和非正常声音，评价模型的好坏。利用特征选择或变换，对特征向量进行优化，并利用参数优化技术优化模型的参数，使识别模型的准确率提高。若原始声音信号中有环境噪声（如白噪声），设y中叠加了一定幅值的白噪声（利用叠加噪声），假设所取样本均是全真模拟，样本可靠。忽略其他与开门无关的声音。忽略较小的系统误差和客观误差。忽略声音识别模型的其他因素对模型的影响。三、符号说明 ------------------倒谱系数 ---------------------采样频率 --------------------线性预测系数 -------------------倒谱系数 -------------------高斯混合模型 ---------------------期望最大化 ------------------算法第步 ------------------算法第步四、问题引入与分析 4.1问题背景的理解随着全球化,网络化,数字化,信息化时代的到来,计算机已经成为人们生活中不可缺少的一部分。。因此,近年来,一些研究人员已提出用音频分析进行监视的应用。相对于视频监控系统,基于声音识别技术的音频监控具有很多优点。 4.2 声音的特征提取以及识别声音信号的特征主要有幅度(或功率)、过零率、邻界带特征矢量、线性预测系数特征矢量()、倒谱特征矢量()、倒谱参数()等等，描述声音信号的特征如此之多，我们应该选择合理的特征参数对声音进行分析便于我们建立一个合理的声音识别模型。 4.3 模拟声音的前期处理附件中的声音信号已经经过了去噪处理，我们要实现模拟声音的前期处理就必须先要给声音加一段噪声，用Matlab给声音加一段噪声根据题目要求选择最简单的函数产生高斯分布序列。而去噪的方法有很多经过查阅资料选用基于双线性变换法的B