基于凌阳单片机的语音识别系统设计 design of voice recognition system based on lingyang single chip.pdfVIP

下载本文档

4
0
约1.22万字
约 4页
2017-08-21 发布于上海
举报
版权申诉

基于凌阳单片机的语音识别系统设计 design of voice recognition system based on lingyang single chip.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于凌阳单片机的语音识别系统设计 design of voice recognition system based on lingyang single chip

第34卷第2期电子工盘师 V01．34No．2 2008年2月 EI正CTRONICENGINEER Feb．2008 基于凌阳单片机的语音识别系统设计董晓宁，张萌 (东南大学电子科学与工程学院，江苏省南京市210096) 摘要：语音识别作为一种人机交互技术，有着十分广泛的应用。介绍一种基于具有DSP(数字信号处理器)功能的凌阳单片机的语音识别系统设计，它能完成针对特定人的若干命令(特定的孤立词)的语音识别。本设计在具体实践时，以汉语言的短命令为识别对象，体现汉语音特征；在系统软件和硬件设计上强调简单实用的特点，简化系统结构，增强控制能力。文中介绍的方法克服了使用DSP 芯片建立同样系统时的一些不足，如设计繁琐、价格高、控制不够灵活等。关键词：语音识别；单片机；特定人；孤立词中图分类号：TN912．3 0引言语音识别根据实际需要和应用场合的不同，可以％曜雹型粥。分为孤立词识别和连续语音识别、特定人识别和非特 l壑些生望型H网．1 定人识别¨引。语音识别追求的主要指标为高识别率、图1语音识别系统的基本结构实时性和大词汇量；而对于一个语音识别系统，还应考虑软硬件设计简单、价格低廉、外围控制灵活、人机交 1．1起止点识别互便捷等特点。现在应用于语音识别的芯片主要为语音信号处理基于语音短时稳定性，当采样频率 DSP(数字信号处理器)芯片，如r11公司的TMS320系为8 16 列。然而，将DSP芯片用于小型语音识别系统中，其 ms。不足之处是很明显的旧’51：引脚多，价格贵，使用繁琐；字音由浊音和清音构成，与噪声相比，浊音表现为控制功能弱，常需要与单片机或FPGA(现场可编程门高能量，清音表现为高过零率。对一帧声音数据，能量阵列)结合，来实现人机交互；常需要外接A／D转换芯和过零率分别用短时段能量特征En和短时段过零率 J 片；引脚为3．3V，与单片机、FPGA、Flash存储器等连表征ZCRn【l之’6o 接时，要考虑电平匹配。这些将使整个系统结构庞大，通过区别于背景噪声可以判别语音起止点。取连设计繁琐。本设计采用具有DSP功能并内置声音续10帧背景噪声数据，计算出IZCT(过零率阈，记为 A／D转换器的凌阳单片机，融合控制和DSP功能，使t脚)及rri(能量阈，记为trrL)：系统大大简化。现在语音特征的提取和识别方法很 tIzcT=rain(1r，k+2盯脚) 多，如隐马尔可夫法对非特定人连续语音有很高的识别率…，但过程繁琐。人们在现实生活中还常常用到式中：k、盯坛。为过零率的均值和标准差；厶为固定值，一些短小的命令来控制被控对象的行为，针对这种特 J。一般取25；，I。，k。分别为能量的最大值和最小值M 定人的孤立词的汉语识别，本设计以语音的线性预测汉字的一个字音由清音加浊音或直接由浊音构系数为语音特征，基于时序的特征值差的分段线性匹成，结尾无清音；孤立词两字音之间空隙很短。则起点配法为识别方法，识别率高，且运算简单，能很好地满判别方法为：连续10帧E。都超过ITL的首帧——针足设计要求。对直接由浊音构成的情况；或连续10帧中3帧ZCRn 1语音识别系统的构成