语音识别及处理 杨媛 07222055 徐雅琨 07211121.doc

语音识别及处理 杨媛 07222055 徐雅琨 07211121.doc

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音识别及处理 杨媛 07222055 徐雅琨 07211121

DSP课程设计 实 验 报 告 语音识别及处理 院(系):电子信息工程学院通信工程系 设计人员:杨媛 徐雅琨 成绩: 工程50 报告20 答辩30 总分 评语: 指导教师签字: 日期:2010年1月19日 目 录 一、设计任务书……………………………………………………………2 二、设计内容………………………………………………………………2 三、设计方案、算法原理说明……………………………………………3 四、程序设计、调试与结果分析…………………………………………5 五、设计(安装)与调试的体会…………………………………………7 六、参考文献………………………………………………………………9 ***附录源程序……………………………………………………………9 一、设计任务书: 1、设计背景: 语音识别(Speech Recognition)是指让机器听懂人说的话,即在各种情况下,准确的识别语音的内容,从而根据其信息,执行人的各种意图或执行特定的任务,其最终目标是实现人与机器进行自然语言通信。利用DSP可以对语音信号进行实时采集、提取语音特征向量、进行语音识别。语音识别系统对语音特征参量的提取可以采用FFT等算法,不同的参数表示不同的频谱包络。本设计要求利用DSP的DMA方式进行信号采集和信号处理,对语音信号进行实时识别。 由于环境的原因,我们采集到语音信号经常含有不同程度的噪声,因此要对语音信号中的噪声滤除。DSP利用直接存储器访问方式DMA采集数据时不打扰CPU,因此CPU可以对语音信号进行实时地滤波。本设计要求利用DSP的DMA方式进行信号采集和信号输出,对语音信号进行数字编码,滤波后进行解码。 2、设计要求及目标: (1)对DMA进行初始化; (2)对A/D、D/A进行初始化; (3)编写DMA中断服务程序,实现语音信号的实时识别; (4)根据识别系统的类型选择一种识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,作为标准模式由机器存储起来,形成标准模式库。 (5)对语音进行特征参数的分析,语音信号经过相同的通道得到语音参数,生成测试模板; (6)将测试模板与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果,从而实现语音的识别。 (7)编写DMA中断服务程序和滤波算法程序,实现语音信号的实时滤波; 3、设计思路: 首先利用DSP对语音信号进行分析,提取语音的特征参数,形成“模板”。语音识别系统对特征参量的提取可采用FFT算法。语音识别和说话人识别中的LPC倒谱和MEL倒谱,都与语音的频谱包络密切相关,不同的参数表示不同的频谱包络。识别时,对其进行特征参数的分析,识别参数可以选择平均能量、过零数或平均过零数、频谱、倒谱、线性预测系数,音长,音调,声调等超音段信息函数。最后将语音参数和模板进行比较,从而实现语音的识别。 利用DSP的DMA方式对外部含噪声的语音信号进行实时采集,语音信号先经过A/D转换为数字信号,利用MCBSP的接收寄存器接收数据。编写滤波算法程序,或调用DSPLIB中的滤波函数,对信号进行滤波。滤波后的数据利用DMA方式送到D/A转换器转换为模拟信号。 4、要求完成的任务: (1)编写C语言程序,并在CCS集成开发环境下调试通过; (2)对语音进行参数分析,和模板进行比较,实现语音识别;将包含噪声的语音信号进行滤波,从扬声器输出端口输出,比较滤波前后的信号的变化; (3)按要求撰写设计报告。 二、设计内容: 利用DSP进行信号采集和信号处理,对语音信号进行实时识别,同时根据识别结果对外部输入的信号进行以下两种模式的处理: (1)利用自适应滤波实现语音信号回波对消; (2)实现声音变调处理; 三、设计方案、算法原理说明: 1、语音识别部分: 语音识别系统选用的方案如图表示: 下面分模块介绍各部分工作原理: (1)CODEC模块 我们的CODEC模块以TLC320AD50为核心,其内部集成了16位A/D和D/A转换器,采样速率最高可达22.05KHZ, 并可通过外部编程进行设置。在TLC320AD50C内部DAC之前有插值滤波器,而在ADC之后有抽样滤波器,接受和发送可以同时进行。它采用两组模拟输入和两组模拟输出,有足够的共模抑制能力,可工作在差分或单端方式。输入增益和输出衰减可以通过外部编程控制。 AD50芯片使用差分输入、单端输出方式,这就需要将音频信号转换成差分信号,采用TLC2272低噪声的运算放大器实现转换功能。最后,AD50单端输出信号经音频功率放大器LM386放大后输出。CODEC内部电路如下图所示: (2)Flash存储器 DSK提供了一个25

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档