- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声音识别模型的建立与评价
【摘要】
声音识别是研发智能防盗门的重要环节, 对正常和非正常开门 (指盗窃开门等声音)的声音进行准确地识别变得尤为重要。 本文对采集到的正常和非正常声 音进行识别模型建立和评价。其主要方法是:利用 80 次声音数据,结合 MATLAB 工具及分析计算,建立正常、非正常声音与数据 y 的均值、方差、短时平均能量均值、短时平均幅度均值、 短时平均过零率均值和短时自相关函数均值之间的关
系的 BP神经网络模型。然后分析模型,确定目标函数 t ,1 表示正常, 0 表示非正常,即对声音进行识别;又进行误差分析,达到误差要求时将 80 个数据代入函数,即为对声音模型进行验证与评价。
针对问题一,首先从 80 次声音数据入手,利用 MATLAB的 load 函数载入到计算机内存, 内存中变量有 Fs 和 y 等变量,其中 Fs 为采用频率, y 为采用数据。再用 sound 函数,播放出声音信号, 从听觉角度比较正常、 非正常声音在响度和音调两方的差异。最后利用 plot 函数绘制出具体的声音波形图,从视觉角度比 较声音的频率与振幅的不同效果。
针对问题二, 采用合适的时域分析处理声音信号, 找出和提取了最重要的特征向量是短时能量和平均幅度、 短时平均过零率、 短时自相关函数, 并比较了它们在表达声音时的不同优越性和特点,用途。
针对问题三,用 MATLAB计算出 80 个正常、非正常声音数据, y 的均值、方差、短时平均能量均值、 短时平均幅度均值、 短时平均过零率均值和短时自相关函数均值,利用这些均值作为 BP神经网络的输入数据 p 且对 p 进行转置。确定目标函数 t ,1 表示正常, 0 表示非正常。进行多次训练达到误差要求,求解和分析模型结果,并对 80 组样本数据进行检验。 最后对 BP神经网络模型进行评价、改进及推广。
针对问题四,利用主成分分析( PCA)特征变换对参数进行优化,先在正常和非正常中分别随机选取声音组号, 再将以上问题得到的对应特征参数均值进行PCA变换,获得新的特征参数 f 正和 f 非能够更具区分性,并用参数优化技术包括语音包络检测、 Delta 特征的引入,获得更好的声音识别率。
针对问题五, 对于原始信号中有叠加一定幅度的白噪声, 前期处理时为了达到优良的消噪效果,采用新兴方法小波去噪原理,先用所给函数得到如 11.mat 的加白噪声的声音,运用 MATLAB中的小波工具箱对含噪信号进行小波分解、阈 值量化、小波重组, 获得的去噪结果与原始信号效果比较, 验证小波去噪的可靠性。
关键词:BP神经网络 时域分析 特征向量 主成分分析 小波去噪原理
1
A题:声音识别模型的建立与评价
1 问题重述
随着家居智能化逐渐普及,智能冰箱、智能清洁机器人、智能电视等已步
入平常老百姓家庭, 但智能化的防盗门还处于研发阶段, 未进入市场。 随着人们对家居安全意识的不断增强, 对防盗、防抢和防砸的门禁系统的智能性提出更高 的要求。基于此,对正常和非正常开门(指盗窃开门等声音)的声音进行识别是 智能防盗门的关键问题和技术,其具有广泛的应用前景和实用价值。
为了进行声音识别模型的建立,我们采集到了正常和非正常开门的声音,
附件中有正常开门声音(如正 1.mat ), 非正常开门声音(如非 1.mat ), 各 40 次开门,共 80 次开门声音数据。该数据可利用 matlab 的 load 函数载入到计算机内存,内存中变量有 Fs 和 y 等变量,其中 Fs 为采用频率, y 为采用数据。利用这些数据要求完成以下工作:
利用 matlab 中的 sound 函数,播放出声音信号, 试听并比较正常和非正
常开门声音的差别, 利用 plot 函数绘制出具体的声音波形图, 总结差别在哪些方面?
利用合适的时域或(和)频域特征表达个声音信号,建立特征向量,写出提取特征向量的具体方法和程序代码。
建立声音识别模型 (二分类模型),利用模型区分正常和非正常声音, 评
价模型的好坏。
试利用特征选择或变换,对特征向量进行优化,并利用参数优化技术优化模型的参数,使识别模型的准确率提高。
若原始声音信号中有环境噪声 (如白噪声),设 y 中叠加了一定幅值的白
噪声(利用 y1=y+(-0.15+0.3*rand(size(y)))*max(y) 叠加噪声),如何对声音进行前期处理?
模型假设 1、假设 80 组样本的采用数据真实、有效、可靠; 2、假设每个样本的采用数据之间相互独立;
3、假设样本音频的录音环境为同一环境且外界环境对数据无影响;
4、假设我们在网上查阅的资料以及结论真实可靠。
2
符号说明
x
x j
表示输入层第 j 个
您可能关注的文档
最近下载
- 第08讲 绝对值三角不等式(5种题型)(原卷版)_1.docx VIP
- 山东师范大学影视文学研究期末考试复习题.docx
- 成品油管道工程项目社会稳定风险评估报告(中国市场经济研究院-工程咨询-甲级资质).pdf VIP
- 大九九乘法表(完美)-乘法表全图.docx VIP
- JGJ-T304-2013:住宅室内装饰装修工程质量验收规范.pdf VIP
- JJG 1124-2016 门座(桥架)起重机动态电子秤检定规程.docx VIP
- 古文观止注音详解卷四秦文修订稿.pdf VIP
- 九年级物理18章电功率集体备课教案.docx VIP
- 过程装备控制技术及应用-全套课件(PDF版).pdf VIP
- 2024马克思主义发展史第2版配套题库里面包含考研真题课后习题和章节题库总共170页.pdf VIP
原创力文档


文档评论(0)