- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机语音处理技术在教学中应用
计算机语音处理技术在教学中应用
摘 要:随着计算机技术的发展,计算机对语音处理的速度越来越快,语音处理质量也越来越好,计算机的普及率目前已很高,在教学中,计算机取代传统录音设备已是必然趋势。本文以Microsoft Speech SDK开发包为基础,采用C#、C++及Matlab编程技术实现口语与听力教学软件的设计,以促进计算机人机对话在语音教学中的应用。
关键字:程序设计 C# C++ Matlab 语音识别出 口语 听力 测试 评价 人机对话
现在语言教学中,听力与口语的教学已占据非常重要的地位,传统语言教学中,常常使用磁带录音机进行听力与口语的训练与测试,这种模式存在着明显的不足:第一,录音时前期准备工作量大,训练、测试周期长,反馈不及时;第二,技术难度较大。一般要经过材料准备、设备调试、教师朗读、录音、试听、翻录等过程,通常需要电教人员与教师配合完成;第三,录音放音设备的保养与维护工作量大,一般学校录音设备配备又少,会正确使用人员又不多,不能满足教师及时的需要,且有的设备年代较久,设备状态不佳;第四,磁带录音不便于编辑且效音质效果不好,还不便于保存;第五,磁带录音一般只用于学生在期中与期末的测试,而平时训练则很少使用。
随着计算机技术的发展,特别是音频处理技术的发展,使计算机用于听力、口语的训练与测试成为可能,目前江苏已采用人机对话的方式进行中考口语听力测试,这就迫切要求学校能适应这种人机对话考试的要求,因此基于计算机人机对话的语口语、听力的训练,将以强大的优势取代传统录音教学方式,这种方式的优势主要表现在以下几个方面:第一,在设备配置上无需专门的录音设备,只要有中等配置要求的计算机、灵敏度高一点的话筒及耳机,就能实现高质量的录音、放音效果,且易于对语音的编辑处理;第二,既可以方便生成听力所需的语音文件,又可以用于学生人机对话的训练与测试;第三,利用计算机的网络功能方便学生在线学习及师生的交流。
设计思想:要想将计算机在口语及听力教学中广泛应用起来,本人经过摸索与实践,从以下几个方面入手,提出了人机对话的设计思想。首先要采用先进的语音处理技术,保证语音的录放效果;其次,计算机软件的操作要方便,易学易用,这样才能使师生接受与使用;第三,既能单机使用,又要能在网络条件下协同使用,并能支持语音应用功能的扩充,及共享其成果;第四,既能提供给学生学自主习使用,又能用于在线的测试与评价。第五,采用模块化结构设计,不断扩展与更新软件,做到边开发边试用,边改进,以更好地满足教学要求。
模块组成与结构:
上图虚线框中为微软免费提供的语音应用开发工具包Microsoft Speech SDK,此软件包可免费获取,其中包含先进的语音识别引擎SR①及语音合成(TTS②)引擎,它支持3种语言的识别(英语,汉语和日语)以及2种语言的合成(英语和汉语)。它以API函数接口的形式提供给用户进行开发,利用这个开发工具很方便地开发各种语音软件。
有了先进的语言处理开发引擎Speech SDK,本人经实践,开发了英语口语与听力的教学应用系统。下面针对各应程序模块的开发加以说明:
一、朗读编辑模块
实现对英语文本朗读要求的编辑,该模块采用C#语言开发,是一个可视化的编辑软件,可对每一单词的朗读要求进行编辑,如重音、音量、语速、语调的编辑,并能够实时试听,支持在线与单机两种编辑模式,可直接输入英语文本,也可导入文本文件进行编辑,最后生成标准的XML文件,提供给Speech SDK生成MP3的语音文件。
二、语音库制作模块
基于Speech SDK的语音开发包,除自带现成的TTS语音库外,还提供真人发音的语音库,并支持免费下载,如:Neospeech的TTS英语语音库③。但在实际应用中,没有针对中小学课本的真人朗读语音库,这大大降低了软件的适用性,因此,在开发时充分考虑这种情况,在此模块中加入了用户自定义录制语音库的功能,用户只需要使用此模块录制好MP3格式的语音,以单词或句子名称存盘,存入于系统定义的目录下,建立索引文件即可。录制语音时用户可以实现对单词、短语和句子进行录音,也可通过网络通过教师间或教师和学生间互相交流进行录音,生成MP3文件,这样语音库就可以由教师学生完成,同时还能收集一些常错的发音,以便对学生进行纠正性教学。当然也可以在网上直接下载单词或短语的MP3音频文件,如:韦氏142000个单词语音库高清版本④,朗文现代2005语音库⑤。
三、测试评价与反馈模块
测试评价与反馈模块由C++ C#及Matlab软件开发,分为客户端和服务器端,这是用于人机对话教学的最重要的一个模块,教师可以通过该模块将测试练习发到服务器上,并对练习设置好评价标准,学生可
文档评论(0)