数学建模声音识别模型的建立与评价..docx

下载文档

54
0
约2.84万字
约 42页
2021-07-02 发布于广西
举报
版权申诉
保障服务

数学建模声音识别模型的建立与评价..docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

声音识别模型的建立与评价【摘要】声音识别是研发智能防盗门的重要环节，对正常和非正常开门（指盗窃开门等声音）的声音进行准确地识别变得尤为重要。本文对采集到的正常和非正常声音进行识别模型建立和评价。其主要方法是：利用 80 次声音数据，结合 MATLAB 工具及分析计算，建立正常、非正常声音与数据 y 的均值、方差、短时平均能量均值、短时平均幅度均值、短时平均过零率均值和短时自相关函数均值之间的关系的 BP神经网络模型。然后分析模型，确定目标函数 t ，1 表示正常， 0 表示非正常，即对声音进行识别；又进行误差分析，达到误差要求时将 80 个数据代入函数，即为对声音模型进行验证与评价。针对问题一，首先从 80 次声音数据入手，利用 MATLAB的 load 函数载入到计算机内存，内存中变量有 Fs 和 y 等变量，其中 Fs 为采用频率， y 为采用数据。再用 sound 函数，播放出声音信号，从听觉角度比较正常、非正常声音在响度和音调两方的差异。最后利用 plot 函数绘制出具体的声音波形图，从视觉角度比较声音的频率与振幅的不同效果。针对问题二，采用合适的时域分析处理声音信号，找出和提取了最重要的特征向量是短时能量和平均幅度、短时平均过零率、短时自相关函数，并比较了它们在表达声音时的不同优越性和特点，用途。针对问题三，用 MATLAB计算出 80 个正常、非正常声音数据， y 的均值、方差、短时平均能量均值、短时平均幅度均值、短时平均过零率均值和短时自相关函数均值，利用这些均值作为 BP神经网络的输入数据 p 且对 p 进行转置。确定目标函数 t ，1 表示正常， 0 表示非正常。进行多次训练达到误差要求，求解和分析模型结果，并对 80 组样本数据进行检验。最后对 BP神经网络模型进行评价、改进及推广。针对问题四，利用主成分分析（ PCA）特征变换对参数进行优化，先在正常和非正常中分别随机选取声音组号，再将以上问题得到的对应特征参数均值进行PCA变换，获得新的特征参数 f 正和 f 非能够更具区分性，并用参数优化技术包括语音包络检测、 Delta 特征的引入，获得更好的声音识别率。针对问题五，对于原始信号中有叠加一定幅度的白噪声，前期处理时为了达到优良的消噪效果，采用新兴方法小波去噪原理，先用所给函数得到如 11.mat 的加白噪声的声音，运用 MATLAB中的小波工具箱对含噪信号进行小波分解、阈值量化、小波重组，获得的去噪结果与原始信号效果比较，验证小波去噪的可靠性。关键词：BP神经网络时域分析特征向量主成分分析小波去噪原理 1 A题：声音识别模型的建立与评价 1 问题重述随着家居智能化逐渐普及，智能冰箱、智能清洁机器人、智能电视等已步入平常老百姓家庭，但智能化的防盗门还处于研发阶段，未进入市场。随着人们对家居安全意识的不断增强，对防盗、防抢和防砸的门禁系统的智能性提出更高的要求。基于此，对正常和非正常开门（指盗窃开门等声音）的声音进行识别是智能防盗门的关键问题和技术，其具有广泛的应用前景和实用价值。为了进行声音识别模型的建立，我们采集到了正常和非正常开门的声音，附件中有正常开门声音（如正 1.mat ）, 非正常开门声音（如非 1.mat ）, 各 40 次开门，共 80 次开门声音数据。该数据可利用 matlab 的 load 函数载入到计算机内存，内存中变量有 Fs 和 y 等变量，其中 Fs 为采用频率， y 为采用数据。利用这些数据要求完成以下工作：利用 matlab 中的 sound 函数，播放出声音信号，试听并比较正常和非正常开门声音的差别，利用 plot 函数绘制出具体的声音波形图，总结差别在哪些方面？利用合适的时域或（和）频域特征表达个声音信号，建立特征向量，写出提取特征向量的具体方法和程序代码。建立声音识别模型（二分类模型），利用模型区分正常和非正常声音，评价模型的好坏。试利用特征选择或变换，对特征向量进行优化，并利用参数优化技术优化模型的参数，使识别模型的准确率提高。若原始声音信号中有环境噪声（如白噪声），设 y 中叠加了一定幅值的白噪声（利用 y1=y+(-0.15+0.3*rand(size(y)))*max(y) 叠加噪声），如何对声音进行前期处理？模型假设 1、假设 80 组样本的采用数据真实、有效、可靠； 2、假设每个样本的采用数据之间相互独立； 3、假设样本音频的录音环境为同一环境且外界环境对数据无影响； 4、假设我们在网上查阅的资料以及结论真实可靠。 2 符号说明 x x j 表示输入层第 j 个