语音识别在多媒体课件中的应用研究-语音识别网.docVIP

下载本文档

1
0
约3.05千字
约 3页
2017-08-11 发布于天津
举报
版权申诉

语音识别在多媒体课件中的应用研究-语音识别网.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音识别在多媒体课件中的应用研究-语音识别网

语音识别在多媒体课件中的应用研究于洪涛 12 1内蒙古民族大学教育科学学院内蒙古通辽 028000 2吉林大学高等教育研究所吉林长春 130012 内容提要：在介绍Macromedia公司的多媒体开发工具Authorware和微软公司的 Speech SDK 5.1语音开发包的基础上，通过《FLASH动画设计》课件实例，详细的论述了Authorware中结合MS Speech SDK 5.1开发语音识别多媒体课件的方法。关键词：Authorware MS Speech SDK 多媒体课件语音识别一、引言语言是人类交流信息最自然、最有效和方便的手段，让多媒体课件能听懂我们说的话，并按照我们的命令去运行，是多媒体课件开发所追求的目标。利用语音识别技术，就能够实现这个目标。语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的技术。目前，语音识别技术已经从实验室走向实用，许多公司都提供语音识别引擎，IBM公司的ViaVoice嵌入式语音识别系统，微软公司推出的Speech SDK提供了一个语音识别和语音合成的二次开发平台，可以识别英语、简体中文和日语，这些语音识别系统为开发语音识别多媒体课件提供了物质条件。目前，国内许多学者利用Speech SDK开发出了语音识别系统。例如《火车票查询系统中语音识别的研究及实现》[1]，《机器人手术网络遥控系统中的语音识别》[2]，都是利用Speech SDK结合VC++开发的。VC++开发工具，并不适合普通教师用来开发多媒体课件，那么，能不能在教师熟悉的开发软件，如Authorware中实现语音识别功能就是有待于解决的问题。二、Authorware开发语音识别多媒体课件概述微软公司 Speech SDK提供关于语音（Speech）处理的一套应用程序编程接口SAPI（Speech Application Programming Interface）。SAPI提供了实现文字-语音转换（Text-to-Speech）和语音识别（Speech Recognition）程序的基本函数，简化了语音编程的难度，降低了语音编程的工作量。Speech SDK采用COM标准开发，地层协议都以COM组件的形式完全独立于应用程序层，为应用人员屏蔽掉复杂的语音技术，充分体现了COM的优点。VC++、VB等程序都可以开发语音识别程序，目前，大部分基于Speech SDK语音识别程序都是用VC++开发的，用VC++、VB等开发工具开发多媒体课件，对大多数教师来说有一定的难度。 Authorware是开发多媒体课件最常用的工具之一，提供了十一种交互，利用这些交互方式可以开发出优秀课件。许多教师都在运用Authorware开发课件，并且取得了丰富的研究成果。在论文《在Authorware中实现多媒体数据库的构造与查询》[3]中介绍了如何在Authorware中访问本地数据库，在论文《运用Authorware7.0制作多媒体课件的几点技巧》[4]中介绍制多媒体课件经验技巧。笔者查阅了大量关于语音识别和Authorware的资料，目前国内还没有用Authorware结合Speech SDK开发具有语音识别的功能的多媒体课件的案例。而大部分教师都参加Authorware培训，有一定的Authorware开发多媒体课件的经验，那么能不能用Authorware结合Speech SDK开发语音识别多媒体课件那？Authorware并不支持COM编程，不能直接调用Speech SDK。笔者通过搜索发现alSR.U32扩展函数[5]，alSR.U32是Authorware的一个外部函数，里面提供了一组函数可以让Authorware利用Speech SDK实现语音识别。因此我们可以在Authorware中通过调用外部函数来调用Speech SDK来开发语音识别多媒体课件。三、《FLASH动画设计》语音识别课件实例（一）《FLASH动画设计》课件简介《FLASH动画设计》多媒体课件是用Authorware开发的，讲解FLASH的五种动画设计方法，既能用与课堂教学，又适合于个别化学习，课件主菜单如图1所示图1Flash动画设计课件菜单（二）《FLASH动画设计》课件语音识别实现《FLASH动画设计》课件提供了鼠标交互和语音识别两中方式来选取教学内容，用鼠标选取按钮或说出按钮的名称都能进入相应教学内容，关于鼠标交互请参考其他书籍，这里只讨论语音识别的方式。我们可以运用语音来控制课件的运行，说出教学内容的名字，进入相应的学习内容，说“上一页”、“下一页”来进行翻页，说“返回”返回到主菜单，说“退出”关闭课件。Speech SDK提供了两种识别方式，听写识别方式和命令识别方式，由于听写识别