《基于MSSDK的文语转换系统lizheng.docVIP

下载本文档

1
0
约 17页
2017-01-18 发布于北京
举报
版权申诉

《基于MSSDK的文语转换系统lizheng.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《基于MSSDK的文语转换系统lizheng

内容摘要：与机器进行语音交流，让机器发出需要的声音，这是人们长期以来梦寐以求的事情，文语转换系统就是让机器通过识别和理解文章段落把文字信号转变为相应的声音信号的高技术。文娱转换是一门交叉学科，近二十年来，文语转换技术取得了更加显著的进步，开始从实验室走向市场。热门娱记，未来10年，文语转换系统将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。很多专家都认为文娱转换技术是2000至2010年间信息技术领域十大重要的科技发展技术之一。本文介绍了利用微软的Microsoft Speech SDK 5.1提供的TTS（text-to-speech）技术开发具有语音朗读功能的应用程序关键词：文语转换 MSSDK COM Abstract：And machinery for voice communication, so that the machine needs a voice, this is what people have long dreamed of, text-to-speech system is to allow machines to identify and understand the paragraphs of the article text signal into the voice signals in the corresponding high-tech. Civic conversion is a cross-discipline, the last 20 years, text-to-speech conversion technology have made more significant progress, starting from the laboratory to the market. Top Yuji, the next 10 years, text-to-speech system will enter the industrial, household appliances, telecommunications, automotive electronics, medical care, family services, consumer electronics and other fields. Many experts agree that cultural conversion technology is the 2000-2010 field of information technology among the 10 important scientific and technological development of the technology. this article introduces How to Create speech-enableed Apllications use the Microsoft Speech SDK 5.1? Key words：Test -To- Speech MSSDK COM 1绪论 1.1. TTS技术概述上世纪90年代中期以来,随着个人计算机的硬件和软件功能越来越强,和现代语音技术的发展,以前在科幻电影中才能看到的会说话的电脑已经成为现实.而TTS技术正是电脑能够说话的关键技术之一TTS是text-to-speech的缩写,英文也称Speech Synthesis即语音合成.语音合成就是一个将文本转化为语音输出的过程,这个过程的工作主要是将输入的文本按字或词分解为音素,并且对文本中的数字、货币单位、单词变形以及标点等要特殊处理的符号进行分析,以及将音素生成数字音频然后用扬声器播放出来或者存为声音文件以后用多媒体软件播放.图1形象地描述了这个过程. ? 图1. text-to-speech实现过程当应用程序需要发声的时候就调用语音合成引擎（SPEECH SYNTHESIS ENGINE）进行语言合成,将文本处理后通过扬声器用近似于人的声音“读”出来,通常还可以通过改变对语音引擎的设置改变“说话” 的速度,声音频率(低沉或者尖锐),声音大小,还能模拟口形、唇形和舌位的变化对声音的影响.面前计算机通过语音合成发出的声音效果听起来就象是录音磁带发出的声音. 与一些用预先录制的声音文件实现发声的应用程序相比,TTS的发声引擎只有几兆大小,不需要大量的声音文件支持,因此可以节省很大的储存空间,并且可以朗读预先未知的任何语句.现在已经有许多应用软件应用TTS技术实现语音功能,例如一些播音软件可以用来读小说或作校对工作,还可以朗读电子邮件,一些电子词典可以读出单词,还可