基于arm的非特定人语音识别系统的设计方案.doc

下载文档 降价啦

0
0
约3.58千字
约 9页
2019-10-16 发布于浙江
举报
版权申诉
保障服务

基于arm的非特定人语音识别系统的设计方案.doc

1、本文档共9页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

[导读]?本系统采用ARM Cortex M3 内核ST 公司的32 位高性能单片机STM32F103C 摘要：本文介绍了一种采用ARM处理器作为控制核心的非特定人语音识别系统的设计方案。方案中的系统利用IC Route公司的非特定语音识别芯片LD3320与ARM Cortex M3内核ST公司的32位高性能单片机STM32F103C 　　0 引言　　语音交互是人类交流和交换信息中最便捷的手段和最重要的媒体，长久以来，人们都希望找寻一种新的途径解决人类与机器的交互方式，希望机器设备能够“听”懂人类的语音信息进行交互，识别其含义并响应、从而做出相应动作，这样的交互方式更能被使用者接受，取代原有的键盘、按钮、开关等传统交互方式，基于非特定人的语音识别技术已然成为人机交互新方式的一个重要发展方向和研究热点。　　语音信号的识别涉及众多学科知识体系，与计算机、语言学、通信、数理统计、信号处理和人工智能等学科都有着密切的关系，由于语音信号具有信息量大、不确定性、动态性和连续性的特点，在语音信号的预处理、特征提取等阶段处理数据量非常大，对软件的处理算法和硬件的处理能力都有较高的要求，传统使用PC机或者工控机等高处理性能的平台实现语音信号识别，但硬软件开发造价无疑是阻碍普及的重要因素，本系统采用ARM Cortex M3 内核ST 公司的32 位高性能单片机STM32F103C 　　1 非特定人语音识别技术原理　　非特定人语音识别技术研究的最终目的是让计算机等设备能够“听懂”人类语音，提取出语音中所包含的特定信息，成为人机通信和交互最便捷的手段。由于语音信号本身具有不确定性、动态性和连续性，这就为准确量化和处理该信号带来非常大的困难，每个人的语音要建立不同的语音样本也为识别的普及带来瓶颈约束。目前的语音识别是先建立特征库然后将待识别的信号经处理与特征库比对得到相似结果判定输出。从本质上属于基于统计模式的基本理论，分语言模型训练、识别分析两个大阶段构成和实现，如图1所示。　　　　声学训练阶段通常是离线完成的，由语言学家对预先收集好的海量语音样本、语言数据库、噪声数据进行信号处理和知识挖掘，通过语音信号处理理论及相应数学算法模型建立语音识别系统所需要的“声学模型”和“语言模型”。　　识别分析阶段通常是在线完成的，对用户实时的语音进行自动识别。识别过程通常又可以分为“前端”和 “后端”两大模块：“前端”模块主要的作用是进行端点检测、降噪、特征提取等；“后端”模块的作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别，得到其包含的文字信息，此外，后端模块还存在一个“自适应”的反馈模块，可以对用户的语音进行自学习，从而对“声学模型”和 “语音模型”进行必要的“校正”，进一步提高识别的准确率。　　2 系统设计的整体结构　　本系统以STM32F103C8T6 微控制器为控制核心，搭配微控制器最小核心电路、LD3320语音识别电路、SD卡电路、电源电路、用户按键输入电路、串口数据输出电路、状态指示电路等综合组成。该系统体积小巧，可以作为嵌入式组件单元融入用户电路或者板卡中，上电后STM32F 　　 3 系统硬件电路设计　　3.1 微控制核心方案选型及电路　　系统采用ARM Cortex M3内核ST公司的32位高性能单片机STM32F103C8T6 为控制核心，该芯片可以达到72 MHz的工作频率，内置高速存储器（64 KB的闪存和20 KB的SRAM），拥有丰富的I/O口资源和链接到两条APB 总线的外设。包括了12 b 的ADC、通用16 b 的定时器、还包括I2C、SPI、USART、USB、CAN等总线或串行通信接口，片内资源和扩展接口都十分丰富，该微控制核心是专门设计于满足高稳定性、低功耗、实时性、高性价比的嵌入式产品应用。该内核芯片可以满足非特定人语音识别的功能要求，利用相关电路构成STM32F 　　　　3.2 非特定人语音识别方案选型及电路　　本系统中选用IC Route公司生产的LD3320非特定人语音识别芯片，该芯片是非特定人语音识别的专用芯片，内部已经集成了语音识别处理器和一些信号调制电路，拥有高性能的A/D转换器、D/A转换器、麦克风音频信号输入接口、音频解码输出接口等，用户只需要用软件编辑好待识别的关键词列表，LD3320最大可以支持 50 条关键词句，把这些列别以字符的形式传送到芯片中，就可以对待识别的语音信号进行近似度分析，识别后输出结果。　　　　LD3320 整体工作电路如图4 所示，总体上可以把电路图分为8个部分，分别是LD3320基础外围电路、电源电路、外部晶体振荡器电路、麦克风信号处理电路、去耦合滤波电路、解码音频去直流成分电路、功能引针输出电路、状态信号指示电