大杂烩计划.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大杂烩计划

项目开发计划(CJB语音识别系统) 引言 编写目的及项目背景 在日常生活中 我们需要打字的地方越来越多 在这其中输入法作为一个重要的环节 体现的尤其重要 比如五笔 拼音 搜狗 输入法等 但这些都是以键盘为媒介的录入系统 主导了我们许多年 但是你想没想过只要集中精力思考问题,无须琢磨怎样拼音,怎样拆字 当您疲劳时,闭上眼、伸伸腰,双手方在脑后,然后轻松地说:开始听写呢? 我们开发的就是这样一种系统 可以将声音直接转化为一个个文字直接输入文档中 让您免去打字的烦恼 可以全身心投入问题的解决中 生僻字也不再是问题 只要你会读 就可以写出来 我们将其命名为CJB语音识别系统 该系统可用于声控打字和语音导航。只要对着微机讲话,不用敲键盘即可打汉字,每分钟可输入150个汉字,是键盘输入的两倍,是普通手写输入的六倍。该系统识别率可达95%以上。并配备了高性能的麦克风,使用便利,特别适合于起草文稿、撰写文章、和准备教案,是文职人员、作家和教育工作者的良好助手 ! 项目背景 目前汉字输入的方式主要有四种:键盘输入,手写输入,扫描输入和我们现在要谈到的语音输入。让我们先来了解一下这四种输入方式。   键盘输入:键盘输入基本上是基于各种输入法,主要又分为字形输入法和拼音输入法。实际上字形输入法是不符合人的写作思维习惯,因为人们在措辞时,头脑中首先反映出的是即将这个词语的语音,所以字形输入法更适合专业录入人员使用。拼音输入法也分两种,一种以词语为输入单位,另一种以语句为输入单位,而后者不符合写作的思维习惯,因为人们在写作时是以词为思考单位。键盘输入法在输入速度有要求的情况下对于键盘操作、指法要求比较高;   手写输入:手写输入是最容易上手的输入方法,但是同样由于手写输入的先天不足,很难达到较高的输入速度;   扫描输入:扫描输入对于硬件要求比较高,主要是适用于资料的整理;   语音输入:语音输入对输入人员的键盘操作能力、指法要求很低,几乎可以说你只要会说汉语,就可以进行语音输入。   语音输入尤其是汉字语音输入经历了很长时间的研究和应用,到目前已经达到了一个相当的高度,所以为了让更多的人、更多不是非常熟悉电脑的人来使用电脑进行汉字输入,我把多年以来使用IBM VIAVOICE语音输入系统的心得体会写下来,使得语音输入这种新的汉字输入方法能得到更广泛的应用。   语音输入是基于语音模型的一种输入方法,涉及大量运算,所以它对CPU和内存有一定的要求,CPU频率越高、内存越大,语音输入就能更好地工作。不过也不需要太担心这个问题,我使用的CPU是赛扬433,内存96MB,基本上能很好的进行语音输入。自然,我们还需要一个耳麦。通过使用IBM VIAVOICE,我们发现这个系统对于耳麦要求并不高,我所用的就是十块钱买来的耳麦,当然性能良好的耳麦对于语音输入也有很大的帮助。 参考资料 詹新明,黄南山,杨灿. 语音识别技术研究进展[J]. 现代计算机 专业版 , 2008, 09 相征,朗朗,王静. 基于基音频能值的端点检测算法[J]. 安徽工程科技学院学报, 2008, 09 沈宏余,李英. 语音端点检测方法的研究[J]. 科学技术与工程, 2008, 08 李景川,董慧颖. 一种改进的基于短时能量的端点检测算法[J]. 沈阳理工大学学报,2008, 06 蔡妍. 语音信号端点检测方法的研究[硕士学位论文][D]. 江南大学, 2008 吴亚栋. 语音识别基础[R]. 上海交通大学计算机系, 2007-01 吴晓平崔光照路康谭保华熊健民刘幺和朱淑琴西安电子科技大学MATLAB扩展编程清华大学出版社I247789S-E服务器一台 可工作具有win7系统及C++平台电脑两台 语音录入装置两套 专业测试环境 软件测试人员 开发单位已具有的条件 可工作具有win7系统及C++平台电脑两台 软件测试人员 尚需创造的条件 I247789S-E服务器一台 语音录入装置两套 专业测试环境 产品 程序 语音识别系统 程序名称 CJB语音识别系统 使用语言 简体中文 存储形式 文本文档 VC++ 文档 语音识别系统概述 语音识别系统的典型原理框图[1,9-10]如图1-1所示。从图中可以看出语音识别系统的本质就是一种模式识别系统,它也包括特征提取、模式匹配、参考模式库等基本单元。由于语音信号是一种典型的非平稳信号,加之呼吸气流、外部噪音、电流干扰等使得语音信号不能直接用于提取特征,而要进行前期的预处理。预处理过程包括预滤波、采样和量化、分帧、加窗、预加重、端点检测等。经过预处理的语音数据就可以进行特征参数提取。在训练阶段,将特征参数进行一定的处理之后,为每个词条得到一个模型,保存为模板库。在识别阶段,语音信号经过相同的通道得到语音参数,生成测试模板,与参考模板进行匹配,将匹配

文档评论(0)

kjm3232 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档