- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于定点DSP的实时语音命令识别模块
基于定点DSP的实时语音命令识别模块
????? 本系统的目的是在廉价定点数字信号处理器(DSP)芯片上实现语音识别。在微机平台,一般采用隐含Markov模型(HMM)进行语音识别,该算法在识别阶段计算量较少,适应性强,但是需要大量的前期训练工作。由于DSP系统存储资源有限,计算速度也比较慢,大运算量的前期训练是无法在有限的DSP资源上独立完成的,因此系统采用了动态时间弯折算法(DTW),以解决模板匹配中时间不定长的问题,实现了一个特定人小词表语音识别系统。下面分别介绍该系统的硬件和软件结构。
??? 1 系统硬件?
??? 系统的电路原理如图1所示。该系统采用Analog Decive公司(ADI)的定点数字信号处理器ADSP2181为核心部件。2181指令字长24位,数据字长16位,在16.67MHz下工作,指令周期可达30ns。用AD73311编码译码器(COEDC)作语音输入输出模拟前端。AD73311是ADI公司的低成本、低功耗通用模拟前端。它具有诸多优良性能:如16位75dB的模数转换信噪比和70dB的数模转换信噪比、输入输出采样频率和增益可编程、小的转换群延时、允许8个芯片级连、工作电压范围宽(2.7~5.5V)、自身带参考电压等,在语音信号处理和有源控制方面得到了广泛的应用。AD73311通过串行口与2181相连。采用一片 27C512作为程序存储器,系统复位后,程序自动由EPROM中加载进入DSP的片内程序存储区运行。还有一片AT29C020作为模板和语音存储器,通过BDMA接口与2181相连。以上四个芯片组成了语音识别的核心电路。系统的译码电路由一片GAL16V8实现,复位和电源监视电路由MAX705实现,还有一片74HC574用来输出识别结果,这就构成了基本的语音识别模块。加上可选的键盘、LCD显示接口和相应的译码电路,即可构成完整的控制器。该控制器具有体积小、成本低的优点。
???2 系统软件
??? 2.1 语音信号的端点检测
??? 所谓端点检测,就是从含噪声的环境中检测出说话人的语音命令。我们采用语音信号的短时能量和过零率来进行端点检测。语音信号的采样频率为8kHz,每帧数据为30ms,共240个采样点,帧交迭10ms,共80个采样点。每隔10ms计算一次短时能量和过零率。短时能量用下面公式计算:
??? 其中N为一帧语音的采样点数(240)。过零率为一帧语音信号穿越零电平的次数。短时能量描述了信号的幅度,而过零率对能量低的清音比较敏感,两者配合起来就可以准确地判断语音信号的开始和结束。
??? 2.2 语音参数的选择和计算
??? 输入的模拟语音信号首先要通过截止频率为4kHz的抗混迭滤波器,然后由AD73311采样和量化。接下来很重要的一环就是特征参数的提取。对特征参数的要求是:(1)能有效地代表语音特征,包括声道特征和听觉特征,具有很好的区分性;(2)各阶参数之间有良好的独立性;(3)特征参数要计算方便,最好有高效的计算方法,以保证语音识别的实时实现。一般选择线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)作为语音识别的参数,两种参数的计算请参考文献[1]和[2]。该系统为每帧信号计算出12阶LPCC系数,加上短时能量和过零率,作为以后的识别参数。以上算法是用ADSP2181的汇编语言实现的定点算法,比纯浮点算法快得多,可以在720μs内完成,从而可以达到实时计算。
??? 大量文献的研究表明,MFCC系数对提高识别率有一定的作用。我们也在ADSP2181上实现了MFCC系数的定点算法,但是与LPCC系数相比, MFCC系数计算有两个缺点:一是计算时间长,一帧参数的计算至少需要1.25ms;二是精度难以保证。由于MFCC系数的计算需要FFT变换和对数操作,影响了计算的动态范围,要保证其在定点DSP上的运算速度,就只有牺牲参数精度。而LPCC参数的计算有递推公式,速度和精度都可以保证。在微机和 DSP平台上分别进行的大量试验表明,LPCC参数已经足以满足我们的识别要求,同时采用LPCC参数,可以减少计算时间,从而降低系统功耗。
??? 2.3 语音的编码与回放
??? 本系统采用8kHz采样频率,精度为16位,数据传输率为128kbps。采用ADPCM算法实现对语音的编码,将采集到的语音样本压缩到32kbps,可以保持清晰的音质,同时大大降低存储需求。为了进一步降低码率,系统还可以采用GSM编码算法,不但合成语音质量好,而且算法比较简单,可以在 ADSP2181定点DSP芯片上实时实现。它的码率为13.6kbps。GSM编码实际上是规则脉冲激励长时线性预测编码(RPE-LTP),它包括预处理、LPC分析、短时分析滤波、长时预测和规则脉冲激励序列编码等五部分。GSM算法比ADPC
您可能关注的文档
- 基于TCN—LON网关的列车控制网络系统的研究.pdf
- 基于TOPSIS和灰色理论的高校教育信息化评价模型.doc
- 基于TMS320LF2407A的SPWM不对称规则采样法的分析与实现.pdf
- 基于U M L序列图的测试方法.pdf
- 基于USB Host的大容量数据采集系统的设计.doc
- 基于USB总线的LED屏幕的仿真与实现.doc
- 基于USB总线的谐波分析系统研究与设计.doc
- 基于USB接口的PROFIBUS DP智能从站.pdf
- 基于USS 协议网络控制系统的采样周期与系统性能.pdf
- 基于VERICUT软件的四轴数控编程仿真.pdf
- 2025年广西民族大学马克思主义基本原理概论期末考试模拟题必考题.docx
- 2025年福州大学至诚学院马克思主义基本原理概论期末考试模拟题必考题.docx
- 2025年厦门华厦学院马克思主义基本原理概论期末考试模拟题附答案.docx
- 2025年常德职业技术学院思想道德修养与法律基础期末考试模拟题新版.docx
- 2025年华中师范大学思想道德修养与法律基础期末考试模拟题必考题.docx
- 2025年内蒙古科技职业学院马克思主义基本原理概论期末考试模拟题必考题.docx
- 2025年内蒙古大学创业学院马克思主义基本原理概论期末考试模拟题附答案.docx
- 2025年南京师范大学中北学院毛泽东思想和中国特色社会主义理论体系概论期末考试模拟题必考题.docx
- 2025年北京师范大学珠海校区思想道德修养与法律基础期末考试模拟题附答案.docx
- 2026届四川省广安市高三一模高考化学试卷试题(含答案详解).doc
最近下载
- T_BJWA 001-2021_健康直饮水水质标准.pdf VIP
- 2025年污水厂技术交底.pdf VIP
- IPC-WHMA-A-620A 线缆及线束组件工艺要求与检验标准.pdf VIP
- 福建农林大学研究生学位论文格式的统一要求(2025年修订).docx VIP
- IPC-A-620培訓教材 培训资料.pdf VIP
- 统编版三年级语文上学期第七单元综合提优卷(B)(含答案).pdf VIP
- 《心理健康与职业生涯》电子教案.pdf VIP
- 肿瘤溶解综合征 (3)ppt课件.pptx VIP
- 高一英语动词的时态、语态和非谓语专项练习(含答案).docx VIP
- 安全生产工作会议记录范文6篇.pdf VIP
原创力文档


文档评论(0)