计算机语音处理技术在教学中应用.docVIP

下载本文档

17
0
约3.32千字
约 8页
2018-09-19 发布于福建
举报
版权申诉

计算机语音处理技术在教学中应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

计算机语音处理技术在教学中应用

计算机语音处理技术在教学中应用　　摘要：随着计算机技术的发展，计算机对语音处理的速度越来越快，语音处理质量也越来越好，计算机的普及率目前已很高，在教学中，计算机取代传统录音设备已是必然趋势。本文以Microsoft Speech SDK开发包为基础，采用C#、C++及Matlab编程技术实现口语与听力教学软件的设计，以促进计算机人机对话在语音教学中的应用。　　关键字：程序设计 C# C++ Matlab 语音识别出口语听力测试评价人机对话　　　　现在语言教学中，听力与口语的教学已占据非常重要的地位，传统语言教学中，常常使用磁带录音机进行听力与口语的训练与测试，这种模式存在着明显的不足：第一，录音时前期准备工作量大，训练、测试周期长，反馈不及时；第二，技术难度较大。一般要经过材料准备、设备调试、教师朗读、录音、试听、翻录等过程，通常需要电教人员与教师配合完成；第三，录音放音设备的保养与维护工作量大，一般学校录音设备配备又少，会正确使用人员又不多，不能满足教师及时的需要，且有的设备年代较久，设备状态不佳；第四，磁带录音不便于编辑且效音质效果不好，还不便于保存；第五，磁带录音一般只用于学生在期中与期末的测试，而平时训练则很少使用。　　随着计算机技术的发展，特别是音频处理技术的发展，使计算机用于听力、口语的训练与测试成为可能，目前江苏已采用人机对话的方式进行中考口语听力测试，这就迫切要求学校能适应这种人机对话考试的要求，因此基于计算机人机对话的语口语、听力的训练，将以强大的优势取代传统录音教学方式，这种方式的优势主要表现在以下几个方面：第一，在设备配置上无需专门的录音设备，只要有中等配置要求的计算机、灵敏度高一点的话筒及耳机，就能实现高质量的录音、放音效果，且易于对语音的编辑处理；第二，既可以方便生成听力所需的语音文件，又可以用于学生人机对话的训练与测试；第三，利用计算机的网络功能方便学生在线学习及师生的交流。　　设计思想：要想将计算机在口语及听力教学中广泛应用起来，本人经过摸索与实践，从以下几个方面入手，提出了人机对话的设计思想。首先要采用先进的语音处理技术，保证语音的录放效果；其次，计算机软件的操作要方便，易学易用，这样才能使师生接受与使用；第三，既能单机使用，又要能在网络条件下协同使用，并能支持语音应用功能的扩充，及共享其成果；第四，既能提供给学生学自主习使用，又能用于在线的测试与评价。第五，采用模块化结构设计，不断扩展与更新软件，做到边开发边试用，边改进，以更好地满足教学要求。　　模块组成与结构：　　　　上图虚线框中为微软免费提供的语音应用开发工具包Microsoft Speech SDK，此软件包可免费获取，其中包含先进的语音识别引擎SR①及语音合成（TTS②）引擎，它支持3种语言的识别（英语，汉语和日语）以及2种语言的合成（英语和汉语）。它以API函数接口的形式提供给用户进行开发，利用这个开发工具很方便地开发各种语音软件。　　有了先进的语言处理开发引擎Speech SDK，本人经实践，开发了英语口语与听力的教学应用系统。下面针对各应程序模块的开发加以说明：　　一、朗读编辑模块　　实现对英语文本朗读要求的编辑，该模块采用C#语言开发，是一个可视化的编辑软件，可对每一单词的朗读要求进行编辑，如重音、音量、语速、语调的编辑，并能够实时试听，支持在线与单机两种编辑模式，可直接输入英语文本，也可导入文本文件进行编辑，最后生成标准的XML文件，提供给Speech SDK生成MP3的语音文件。　　二、语音库制作模块　　基于Speech SDK的语音开发包，除自带现成的TTS语音库外，还提供真人发音的语音库，并支持免费下载，如:Neospeech的TTS英语语音库③。但在实际应用中，没有针对中小学课本的真人朗读语音库，这大大降低了软件的适用性，因此，在开发时充分考虑这种情况，在此模块中加入了用户自定义录制语音库的功能，用户只需要使用此模块录制好MP3格式的语音，以单词或句子名称存盘，存入于系统定义的目录下，建立索引文件即可。录制语音时用户可以实现对单词、短语和句子进行录音，也可通过网络通过教师间或教师和学生间互相交流进行录音，生成MP3文件，这样语音库就可以由教师学生完成，同时还能收集一些常错的发音，以便对学生进行纠正性教学。当然也可以在网上直接下载单词或短语的MP3音频文件，如:韦氏142000个单词语音库高清版本④，朗文现代2005语音库⑤。　　三、测试评价与反馈模块　　测试评价与反馈模块由C++ C#及Matlab软件开发，分为客户端和服务器端，这是用于人机对话教学的最重要的一个模块，教师可以通过该模块将测试练习发到服务器上，并对练习设置好评价标准，学生可