基于科大讯飞MSP的粤语自助学习系统的设计.docVIP

基于科大讯飞MSP的粤语自助学习系统的设计.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档,助力人生,欢迎关注小编! 基于科大讯飞MSP的粤语自助学习系统的设计 摘要:本文分析了基于科大讯飞MSP的粤语自助学习系统的工作原理,选择MSP 2.0开发包作为构建系统的核心技术.QISR接口完成语音识别,实现将说话人的语音信息转换为相应文本信息。此外通过QTTS接口调用相关函数完成文本语音转换,实现将识别结果以粤语发音输出。最后,在vc++ 6.0环境下实现粤语自助学习软件系统,该软件可提供简单的粤语学习功能。 关键词:粤语自助学习系统;文本语音转换;语音识别;科大讯飞MSP2.0 中图分类号:TP311.52 文献标识码:A 文章编号:1007-9599 (2020) 03-0000-02 1 引言 计算机辅助语言学习已经成为时下流行的语言学习方式,目前市场上就有多款英语学习软件,它们已经具备了单词查询、语音表达、口语纠正以及学习资源共享等功能,这极大地提高了英语学习的效率及自主性。 粤语(广东话)通行于两广、港澳地区,在全球有近1.2亿使用人口,亦是唯一除普通话外拥有完善文字系统的汉语。相较于英语,粤语学习同样存在着大量需求。但目前还没有针对粤语听说能力训练的计算机辅助学习系统,其主要原因是语音引擎开发周期长,开发难度大,如果单独为粤语学习系统开发语音引擎,代价过高。科大讯飞MSP(Mobile Speech Platform)的发布,大大简化的了这一过程,它自带一个基于WEB的、功能强大的语音引擎,支持英语、日语、汉语普通话以及多种方言(包括粤语)的语音识别及语音合成,利用它,我们可以方便快速的开发相关的应用程序。本文叙述了如何在科大讯飞MSP平台下开发一个粤语自助学习软件系统。 2 基于科大讯飞MSP的粤语自助学习系统的工作原理 粤语自助学习系统的核心功能就是将说话人的汉语普通话发音转换成粤语发音,实现的关键技术包括语音识别技术(Speech Recognition,SR)和文本语音转换技术(Text To Speech,TTS)。运用SR技术可将说话人的普通话语音信息转化为相应的文本信息,运用TTS技术则可将文本信息转换成相应的粤语语音信息。将两种技术有机结合,就可实现将普通话发音转换成粤语发音的功能。 3 科大讯飞MSP移动语音开发平台 3.1 科大讯飞MSP语音开发平台简介 本文采用科大讯飞MSP2.0中的语音引擎实现语音识别和语音合成的功能。科大讯飞(Mobile Speech Platform 2.0)平台是基于科大讯飞公司已有的ISP和IMS产品,开发出的一款符合移动互联网用户使用的语音应用开发平台,提供语音合成、语音识别等服务,为语音应用开发者提供方便易用的开发接口,使得用户能够基于该开发接口进行多种语音应用开发。其主要功能有: (1)实现基于HTTP协议的语音应用服务器,集成讯飞公司最新的语音引擎,支持语音合成、语音识别等服务; (2)提供基于移动平台和PC上的语音客户端子系统,内部集成音频处理和音频编解码模块,提供关于语音合成、语音识别的完善的API。 3.2 QISR接口 语音识别的功能是由QISR接口实现的。在MSP2.0客户端子系统中关于ISR提供如下函数调用: QISRInit,初始化MSC的ISR部分;QISRSessionBegin,开始一个ISR会话;QISRGrammarActivate,传入语法;QISRAudioWrite,写入用来识别的语音;QISRGetResult,获取识别结果;QISRSessionEnd,结束一路会话;ISRGetParam,获取与识别交互相关的参数;QISRFini,逆初始化MSC的ISR部分。 3.3 QTTS接口 文本语音转换功能是由QTTS接口实现的。在MSP2.0客户端子系统中关于TTS提供如下函数调用: 4 基于MSP2.0的粤语学习系统的实现 5 结束语 基于MSP2.0的粤语自助学习系统使学习者足不出户就可轻松完成粤语学习,但是目前该系统只能够完成简单的发音替换,对于一些粤语特有的词汇还不能进行智能的识别及替换。日后,笔者仍会在语音识别的效率以及普通话粤语的词汇替换等方面做进一步的研究,期望有更加智能化的粤语学习系统能够得到应用,以满足足更加丰富、多样的粤语学习需求。

文档评论(0)

s64851 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6120215050000015

1亿VIP精品文档

相关文档