湖南科技大学试编.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
湖南科技大学信息与电气工程学院DSP原理及应用语音识别器的设计学院 信息与电气工程学院班级 13级自动化3班姓名 冯伟 学号 1304020319 2016年5月1 概述语音识别(Speech Recognition)是指让机器听懂人说的话,即在各种情况下,准确的识别语音的内容,从而根据其信息,执行人的各种意图或执行特定的任务,其最终目标是实现人与机器进行自然语言通信。利用DSP可以对语音信号进行实时采集、提取语音特征向量、进行语音识别。语音识别系统对语音特征参量的提取可以采用FFT等算法,不同的参数表示不同的频谱包络。本设计要求利用DSP的DMA方式进行信号采集和信号处理,对语音信号进行实时识别。语音识别按不同的角度有以下几种分类方法:1.识别的单位分类:有孤立词识别、音素识别、音节识别、孤立句识别、连续语音识别和理解。2.识别的词汇量分类:有小词汇(10-50个)、中词汇(50-200个)、大词汇(200以上)等。3.讲话人的范围分类:有单个特定讲话人、多讲话人和与讲话者无关。 4.识别的方法分类:有模块匹配法、随机模型法和概率语法分析法。本实验的主要任务就是通过TMS30VC5402对语音信号“0”、“1”、“2”进行训练和识别,并由相应的灯LED0、LED1、LED2亮来显示结果是否正确;该系统核心识别算法采用动态时间规整(DTW)算法,主要流程包括预处理、端点检测、提取特征值、模式匹配和模板训练。1.2 DSP系统设计的方法和步骤(1)对A/D、D/A进行初始化;(2)根据识别系统的类型选择一种识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,作为标准模式由机器存储起来,形成标准模式库。(3)对语音进行特征参数的分析,语音信号经过相同的通道得到语音参数,生成测试模板;(4)将测试模板与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果,从而实现语音的识别。2.1设计总体方案语音识别基本原理如图1所示。模拟语音信号经过数字化处理(即采样和量化过程)之后,再经去噪和预加重环节得到较干净的数字语音信号。信号起止点检测的主要作用是从各类背景噪声中找出语音的开始和终止点。这一环节对于后续特征参数的提取非常重要。在孤立词语音识别中,确定语音起止点可有效减少系统计算量。另外,在相对较安静的环境下,依靠短时能量与过零率这两个特征就可以很好地完成语音信号的起止点判决。整个语音识别系统可分为两个阶段,即训练阶段和识别阶段。在训练阶段,由用户说出若干训练字,系统根据一定算法建立上述训练语句的特征参考模板;在识别阶段,则从使用者的发音资料中先导出相关特征参量,再将这些参量与事先训练好的特征参考模板进行相似度计算(即模式匹配)。若两者的相似度大于设定的门限值,则予以确认,反之系统则会拒识。(实际中,采用相似度最大者作为匹配结果输出)3硬件设计(1). 系统构成??? 这里采用DSP芯片为核心(图2),系统包括直接双访问快速SRAM、一路ADC/一路DAC及相应的模拟信号放大器和抗混叠滤波器。外部只需扩展FLASH存储器、电源模块等少量电路即可构成完整系统应用。(2).系统主要功能模块构成语音处理模块采用TI TMS320VC5402,其主要特点包括:采用改进的哈佛结构,一条程序总线(PB),三条数据总线(CB,DB,EB)和四条地址总线(PAB,CAB,DAB,EAB),带有专用硬件逻辑CPU(40位算术逻辑单元(ALU),包括1个40位桶形移位器和二个40位累加器;一个17×17乘法器和一个40位专用加法器,允许16位带或不带符号的乘法),片内存储器(八个辅助寄存器及一个软件栈),片内外专用的指令集,允许使用业界最先进的定点DSP C语言编译器。TMS320VC5402含4 KB的片内ROM和16 KB的双存取RAM,一个HPI(HostPortInterface)接口,二个多通道缓冲单口MCBSP(Multi-Channel Buffered SerialPort),单周期指令执行时间10 ns,带有符合IEEE1149.1标准的JTAG边界扫描仿真逻辑。语音输入、输出的模拟前端采用TI公司的TLC320ADSOC,它是一款集成ADC和DAC于一体的模拟接口电路,并且与DSP接口简单,性能高、功耗低,已成为当前语音处理的主流产品。16位数据结构,音频采样频率为2~22.05 kHz,内含抗混叠滤波器和重构滤波器的模拟接口芯片,还有一个能与许多DSP芯片相连的同步串行通信接口。TLC320AD50C片内还包括一个定时器(调整采样率和帧同步延时)和控制器(调整编程放大增益、锁相环PLL、主从模式)。TLC320AD50C与TMS320VC5402的硬件连接,如图3所示。4语音识别算法软

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档