大杂烩计划.docVIP

下载本文档

1
0
约1.17万字
约 21页
2017-03-19 发布于河南
举报
版权申诉

大杂烩计划.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

大杂烩计划

项目开发计划（CJB语音识别系统）引言编写目的及项目背景在日常生活中我们需要打字的地方越来越多在这其中输入法作为一个重要的环节体现的尤其重要比如五笔拼音搜狗输入法等但这些都是以键盘为媒介的录入系统主导了我们许多年但是你想没想过只要集中精力思考问题，无须琢磨怎样拼音，怎样拆字当您疲劳时,闭上眼、伸伸腰，双手方在脑后，然后轻松地说：开始听写呢？我们开发的就是这样一种系统可以将声音直接转化为一个个文字直接输入文档中让您免去打字的烦恼可以全身心投入问题的解决中生僻字也不再是问题只要你会读就可以写出来我们将其命名为CJB语音识别系统该系统可用于声控打字和语音导航。只要对着微机讲话，不用敲键盘即可打汉字，每分钟可输入150个汉字，是键盘输入的两倍，是普通手写输入的六倍。该系统识别率可达95%以上。并配备了高性能的麦克风，使用便利，特别适合于起草文稿、撰写文章、和准备教案，是文职人员、作家和教育工作者的良好助手！项目背景目前汉字输入的方式主要有四种：键盘输入，手写输入，扫描输入和我们现在要谈到的语音输入。让我们先来了解一下这四种输入方式。　　键盘输入：键盘输入基本上是基于各种输入法，主要又分为字形输入法和拼音输入法。实际上字形输入法是不符合人的写作思维习惯，因为人们在措辞时，头脑中首先反映出的是即将这个词语的语音，所以字形输入法更适合专业录入人员使用。拼音输入法也分两种，一种以词语为输入单位，另一种以语句为输入单位，而后者不符合写作的思维习惯，因为人们在写作时是以词为思考单位。键盘输入法在输入速度有要求的情况下对于键盘操作、指法要求比较高；　　手写输入：手写输入是最容易上手的输入方法，但是同样由于手写输入的先天不足，很难达到较高的输入速度；　　扫描输入：扫描输入对于硬件要求比较高，主要是适用于资料的整理；　　语音输入：语音输入对输入人员的键盘操作能力、指法要求很低，几乎可以说你只要会说汉语，就可以进行语音输入。　　语音输入尤其是汉字语音输入经历了很长时间的研究和应用，到目前已经达到了一个相当的高度，所以为了让更多的人、更多不是非常熟悉电脑的人来使用电脑进行汉字输入，我把多年以来使用IBM VIAVOICE语音输入系统的心得体会写下来，使得语音输入这种新的汉字输入方法能得到更广泛的应用。　　语音输入是基于语音模型的一种输入方法，涉及大量运算，所以它对CPU和内存有一定的要求，CPU频率越高、内存越大，语音输入就能更好地工作。不过也不需要太担心这个问题，我使用的CPU是赛扬433，内存96MB，基本上能很好的进行语音输入。自然，我们还需要一个耳麦。通过使用IBM VIAVOICE，我们发现这个系统对于耳麦要求并不高，我所用的就是十块钱买来的耳麦，当然性能良好的耳麦对于语音输入也有很大的帮助。参考资料詹新明,黄南山,杨灿. 语音识别技术研究进展[J]. 现代计算机专业版 , 2008, 09 相征,朗朗,王静. 基于基音频能值的端点检测算法[J]. 安徽工程科技学院学报, 2008, 09 沈宏余,李英. 语音端点检测方法的研究[J]. 科学技术与工程, 2008, 08 李景川,董慧颖. 一种改进的基于短时能量的端点检测算法[J]. 沈阳理工大学学报,2008, 06 蔡妍. 语音信号端点检测方法的研究[硕士学位论文][D]. 江南大学, 2008 吴亚栋. 语音识别基础[R]. 上海交通大学计算机系, 2007-01 吴晓平崔光照路康谭保华熊健民刘幺和朱淑琴西安电子科技大学MATLAB扩展编程清华大学出版社I247789S-E服务器一台可工作具有win7系统及C++平台电脑两台语音录入装置两套专业测试环境软件测试人员开发单位已具有的条件可工作具有win7系统及C++平台电脑两台软件测试人员尚需创造的条件 I247789S-E服务器一台语音录入装置两套专业测试环境产品程序语音识别系统程序名称 CJB语音识别系统使用语言简体中文存储形式文本文档 VC++ 文档语音识别系统概述语音识别系统的典型原理框图[1,9-10]如图1-1所示。从图中可以看出语音识别系统的本质就是一种模式识别系统，它也包括特征提取、模式匹配、参考模式库等基本单元。由于语音信号是一种典型的非平稳信号，加之呼吸气流、外部噪音、电流干扰等使得语音信号不能直接用于提取特征，而要进行前期的预处理。预处理过程包括预滤波、采样和量化、分帧、加窗、预加重、端点检测等。经过预处理的语音数据就可以进行特征参数提取。在训练阶段，将特征参数进行一定的处理之后，为每个词条得到一个模型，保存为模板库。在识别阶段，语音信号经过相同的通道得到语音参数，生成测试模板，与参考模板进行匹配，将匹配