DSP语音识别实验报告汇编.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DSP语音识别实验报告汇编

DSP课程设计 实验报告 语音识别 院(系):电子信息工程学院自动化系 设计人员:李彬 学号设计人员:宋淦泉 学号 成绩: 工程设计50 报告20 答辩30 总分 评语: 指导教师签字: 日期: 目录 设计任务书 实验概述 实验目的 设计内容 设计方案、算法原理说明 设计步骤 算法原理说明 程序设计、调试与结果分析 算法流程图 主程序 测试过程及结果分析 设计(安装)与调试的体会 编程及程序运行中遇到的问题及解决办法 本次实验的心得体会 参考文献 设计任务书 实验概述: 语言是人类特有的功能,声音是人类最常用的工具。通过语音传递信息是人类最重要最有效最常用和最方便的信息交换形式。语音信号是人类进行思想沟通和情感交流的最主要的途径。让计算机能听懂人类的语言,是自计算机诞生以来人类梦寐以求的想法。在本实验中,将针对DTW算法,实现对最简单的单音信号进行语音识别的问题。 语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(例如人在说话时的表情、手势等细微动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。   语音识别技术主要包括特征提取技术、模式匹配准则及模训练技术三个方面。此外,还涉及到语音识别单元的选取。 语音识别系统的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等多种学科领域,是一个多学科综合性研究领域。 语音识别系统的分类根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统、连接字语音识别系统以及连续字语音识别系统。根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限量词汇量语音识别系统。   一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模版匹配的方法以及利用人工神经网络的方法。   基于声道模型和语音知识的方法起步较早,在语音识别技术提出的开始,就有了这方面的研究。但由于其模型及语音知识过于复杂,还没有达到实用阶段。 人工神经网络的方法是80年代末期提出的一种新的语音识别方法。人工神经网络本质上是一个自适应非线性动力学系统,模拟人类神经活动的原理,具有自适应性、并行性、鲁棒性、容错性和学习特性,在结构和算法上都显示出实力。但由于存在训练、识别时间太长的缺点,目前仍处于实验探索阶段。 模版匹配方法中,要经过四个步骤:特征提取、模版训练、模版分类、判决。 语音识别(Speech Recognition)是指让机器听懂人说的话,即在各种情况下,准确识别语音的内容,从而根据其信息,执行人的各种意图或执行特定的任其最终目标是实现人与机器进行自然语言通信。 各模块工作原理为: (一)CODEC模块 CODEC模块以TLC320AD50为核心,其内部集成了16位A/D和D/A转换器,采样速率最高可达22.05KHZ, 并可通过外部编程进行设置。在TLC320AD50C内部DAC之前有插值滤波器,而在ADC之后有抽样滤波器,接受和发送可以同时进行。它采用两组模拟输入和两组模拟输出,有足够的共模抑制能力,可工作在差分或单端方式。输入增益和输出衰减可以通过外部编程控制。 AD50芯片使用差分输入、单端输出方式,这就需要将音频信号转换成差分信号,采用TLC2272低噪声的运算放大器实现转换功能。最后,AD50单端输出信号经音频功率放大器LM386放大后输出。CODEC内部电路如下图所示: (二)Flash存储器 DSK提供了一个256K×16bit 字的低电平flash存储器。FLASH可用于DSP的数据和程序存储空间。 模拟输入 模拟输出 (三)语音信号识别模块 语音信号中含有丰富的信息,如何从中提取出对语音识别有用的信息特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程输入 识别输出 语音 训练 类聚 语音识别的原理框图 语音信号的预处理包括反混叠滤波,A/D变换,预加重,加窗和分帧处理等。预加重的目的是提升高频部分,使信号的频谱变得平坦,以保持在信号的整个频带内,具有同样的信噪比,便于声道参数分析。在语音信号的数

文档评论(0)

bbnnmm885599 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档