基于Speech_SDK的语音信号识别.doc

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
*大学 课 程 设 计 (说明书) 基于Speech SDK的语音信号识别 班级 / 学号 * 学 生 姓 名 * 指 导 教 师 * *大学 课 程 设 计 任 务 书 课 程 名 称 综合课程设计 院(系) 电*院 专业 电*程 班级 * 学号 * 姓名 * 课程设计题目 基于Speech SDK的语音信号识别 课程设计时间: 20* 日 课程设计的内容及要求: 一、设计说明 语音识别研究在国内外已经有了很多年的发展历史,特别是在近些年,随着实验室条件下语音识别的飞速发展,语音识别的应用已经离我们越来越近。语音识别作为一种重要的信息识别方式在金融、人机交互、电信等领域有着极大的应用空间。 课程设计基本要求 ① 学会 Speech SDK 的使用,掌握其语音识别工具包的设计方法。 ② 掌握在 Windows 环境下语音信号采集的方法。 ③ 掌握语音信号识别的基本概念、基本理论和基本方法。 ④ 掌握语音信号识别经典算法。 ⑤ 学会用Speech SDK对信号进行识别。 三、实验要求 1.根据设计要求制定方案; 2.进行语音测试数据的分析。 四、推荐参考资料 [1] 李禹才, 左友东, 郑秀清 等. 基于Speech SDK 的语音控制应用程序的设计与实现[J].计算机应用, 2004 [2]易克初,田斌,付强编著 .语音信号处理 .北京:国防工业出版社,2000 [3]胡航编著.语音信号处理.哈尔滨:哈尔滨工业大学出版社, 2000 [4]蔡莲红,黄德智,蔡锐.现代语音技术基础与应用[M].清华大学出版社,2003. 五、按照要求撰写课程设计报告 指导教师 2011 年 12 月 19 日 负责教师 年 月 日 学生签字 2011 年 12 月 19 日 成绩评定表 评语、建议或需要说明的问题: 指导教师签字: 日期: 成 绩 目录 一、 概述 3 1. 分类 3 2. 语音信号处理 3 3. Microsoft Speech SDK简介 5 二、 方案论证 6 三、 程序设计 8 1. 窗口载入及初始化子程序 8 2. 语音命令子程序 9 3. 听写子程序 9 4. 朗读子程序 10 5. 预处理及语法规则 11 四、 性能测试 12 1. 程序界面载入测试 12 2. 孤立词识别测试 12 3. 听写模式测试 14 五、 结论 15 六、 课设体会及合理化建议 15 附录 I 源程序 17 附录 Ⅱ 语法规则 20 概述 近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。语音识别是一门交叉学科语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。 根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。非特定人语音识别系统,但它要比针对特定人的识别困难得多。语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统,语音控制系统,智能对话查询系统,等等。 语音识别方法主要是模式匹配法。在训练阶段,用户将词汇表中的每一词一遍,并且将其特征矢量作为模板存入模板库。在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。 前端处理是指在特征提取之前,先对原始语音进行处理,部分消除噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。最常用的前端处理有端点检测和语音增强。端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高模型

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档