基于arm2103的语音识别系统设计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于ARM2103的语音识别 系统设计 自动化与电气工程学院 主要内容 设计课题 学习语音识别的基础原理和方法,设计语音识别系统。基于ARM2103,设计硬件系统(能够采集声音,存储声音片段),编程语音识别算法的程序,能够识别简单的语音信号,如“前进”、“后退”、“停”等。并且进行实验,验证语音识别算法的有效性。 设计方案 (一)、语音识别系统的硬件设计 (二)、语音识别系统的软件设计 语音识别系统的硬件设计 按照设计要求,本设计课题的硬件系统包括声音采集系统、中央处理系统(ARM2103)与输出显示系统。设计中我们利用ARM2103上自带的4个LED灯来分别表示“前进”、“后退”“左转”“右转”四个指令。 硬件系统原理框图 声音采集系统 语音信号由麦克接收后,经过前置的两级放大电路将语音信号放大约100-200倍,才能变成ARM单片机可以检测到的电压信号,然后信号经过功率放大电路后连接到ARM的A/D转换端口进行语音信号采集。 语音信号放大电路 前置放大电路我们采用两级的LM324放大,通过改变C1、C2的值我们可以用来采集不同频率的语音信号。由于此放大电路是由单电源供电,我们使用R4-R7是为LM324提供了参考电压,使之可以工作在正常的范围内。R1、R2是输入电阻,最后的电阻为输出电阻。 功率放大电路 功率放大电路是用LM386组成的OTL功率放大电路,Rp1为音量调节电位器,C1为旁路电容,电位器Rp2和C2构成增益调节电路,Rp2越小,增益越大,最大增益为46Db,C3为滤波电容,滤掉电源的高频成分,R和C4串联组成校正网路,防止电路自激。C5为耦合电容,电源从6脚输入,2、4脚接地。 输出显示系统 语音信号与模版信号匹配后对输入的语音指令进行识别,我们我们利用ARM2103自带的LED灯显示指令是否被识别。显示电路采用了灌电流的方式来驱动发光二极管,由于微控制器LPC2103I/O口提供的灌电流大于其拉电流,采用此驱动方式可以保证LED发光。 语音识别系统的软件设计 软件系统设计主要包括语音信号预处理、特征提取与模板匹配三个方面。 软件系统流程图 语音识别流程 我们首先采集模板语音信号,采集后的语音信号经过预处理(预加重、分帧处理、窗化处理)后求取LPC系数,进而求取倒谱系数。 我们将模板信号保存到ARM2103处理器中,采用麦克风输入语音信号,输入的语音信号经过过零率判断其是否有效,有效后进行预处理求出倒谱系数,采用DTW算法进行模板匹配,进而控制LED灯的亮灭。 LPC系数求取公式: 求出后对其求取对数功率谱。 LPCC系数求取方法是对LPC系数的对数进行傅里叶反变换,或者使用声道系统的传递函数H z 求取。 DTW算法是将时间规整与距离测度的计算结合在一起的一种非线性的规整技术,是把测试的矢量时间轴采用非线性算法与参考模板进行匹配,函数满足下列公式: DTW算法是采用局部最佳化处理自动寻找最近的路径,并且利用此路径将两个互相参考的特征矢量间的累积失真最小化。 主要程序 端点检测程序: 其中的zer为预设的过零率。首先循环的采集第一帧的100个采样点,当100个采样点中,有计算得到的过零率zero zer的时候即认为语音信号为有效值,开始采集并保存数据。其中的data[i]为存储数据的数组。 主要程序 倒谱系数算法: 求取得到的倒普系数我们保存在a[]数组中,并且在程序的开始我们定义了全局变量vc_cepstral[120] 0 ;mf_cepstral[120] 0 ;mb_cepstral[120] 0 ;用来存储模板和识别信号的倒普系数。这样方便了我们后期程序对数组的调用。 毕业设计结论 经过3个月的努力,我基本掌握了利用单片机ARM2103进行语音识别系统开发的主要步骤,基本掌握了语音信号的预处理、倒谱系数求取、利用DTW算法进行模板匹配、语音及功率放大电路的原理、利用TKStudio编写程序、利用H-Flasher烧写程序等,但是由于程序的烧写存在的问题导致程序没有成功移植到ARM单片机中。 谢谢各位评委老师的的评阅 * * * * 毕业设计课题 1 毕业设计方案 2 毕业设计结果 3 语音信号 麦克风采集 ARM2103处理 5V电源 放大电路 LED灯亮灭

文档评论(0)

管理学科 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档