基于Speech_SDK的语音信号识别.doc

下载文档 降价啦

6
0
约1.24万字
约 22页
2018-01-24 发布于贵州
举报
版权申诉
保障服务

基于Speech_SDK的语音信号识别.doc

1、本文档共22页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

*大学课程设计（说明书）基于Speech SDK的语音信号识别班级 / 学号 * 学生姓名 * 指导教师 * *大学课程设计任务书课程名称综合课程设计院（系）电*院专业电*程班级 * 学号 * 姓名 * 课程设计题目基于Speech SDK的语音信号识别课程设计时间: 20* 日课程设计的内容及要求：一、设计说明语音识别研究在国内外已经有了很多年的发展历史，特别是在近些年，随着实验室条件下语音识别的飞速发展，语音识别的应用已经离我们越来越近。语音识别作为一种重要的信息识别方式在金融、人机交互、电信等领域有着极大的应用空间。课程设计基本要求① 学会 Speech SDK 的使用，掌握其语音识别工具包的设计方法。② 掌握在 Windows 环境下语音信号采集的方法。③ 掌握语音信号识别的基本概念、基本理论和基本方法。④ 掌握语音信号识别经典算法。⑤ 学会用Speech SDK对信号进行识别。三、实验要求 1．根据设计要求制定方案； 2．进行语音测试数据的分析。四、推荐参考资料 [1] 李禹才, 左友东, 郑秀清等. 基于Speech SDK 的语音控制应用程序的设计与实现[J].计算机应用, 2004 [2]易克初，田斌，付强编著 .语音信号处理 .北京:国防工业出版社,2000 [3]胡航编著.语音信号处理.哈尔滨：哈尔滨工业大学出版社， 2000 [4]蔡莲红，黄德智，蔡锐．现代语音技术基础与应用[M]．清华大学出版社，2003．五、按照要求撰写课程设计报告指导教师 2011 年 12 月 19 日负责教师年月日学生签字 2011 年 12 月 19 日成绩评定表评语、建议或需要说明的问题：指导教师签字：日期：成绩目录一、概述 3 1. 分类 3 2. 语音信号处理 3 3. Microsoft Speech SDK简介 5 二、方案论证 6 三、程序设计 8 1. 窗口载入及初始化子程序 8 2. 语音命令子程序 9 3. 听写子程序 9 4. 朗读子程序 10 5. 预处理及语法规则 11 四、性能测试 12 1．程序界面载入测试 12 2．孤立词识别测试 12 3．听写模式测试 14 五、结论 15 六、课设体会及合理化建议 15 附录 I 源程序 17 附录 Ⅱ 语法规则 20 概述近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。语音识别是一门交叉学科语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。根据识别的对象不同，语音识别任务大体可分为3类，即孤立词识别（isolated word recognition)，关键词识别（或称关键词检出，keyword spotting)和连续语音识别。其中，孤立词识别的任务是识别事先已知的孤立的词，如“开机”、“关机”等；连续语音识别的任务则是识别任意的连续语音，如一个句子或一段话；连续语音流中的关键词检测针对的是连续语音，但它并不识别全部文字，而只是检测已知的若干关键词在何处出现，如在一段话中检测“计算机”、“世界”这两个词。根据针对的发音人，可以把语音识别技术分为特定人语音识别和非特定人语音识别，前者只能识别一个或几个人的语音，而后者则可以被任何人使用。非特定人语音识别系统，但它要比针对特定人的识别困难得多。语音识别的应用领域非常广泛，常见的应用系统有：语音输入系统，语音控制系统，智能对话查询系统，等等。语音识别方法主要是模式匹配法。在训练阶段，用户将词汇表中的每一词一遍，并且将其特征矢量作为模板存入模板库。在识别阶段，将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较，将相似度最高者作为识别结果输出。前端处理是指在特征提取之前，先对原始语音进行处理，部分消除噪声和不同说话人带来的影响，使处理后的信号更能反映语音的本质特征。最常用的前端处理有端点检测和语音增强。端点检测是指在语音信号中将语音和非语音信号时段区分开来，准确地确定出语音信号的起始点。经过端点检测后，后续处理就可以只对语音信号进行，这对提高模型