基于嵌入式芯片智能语音系统设计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于嵌入式芯片智能语音系统设计

基于嵌入式芯片智能语音系统设计   摘 要 随着计算机科学技术和人工智能的飞速发展,其应用已经渗透到工业、农业、商业等各个领域。在诸多人工智能应用中,TTS技术(文本-语言转换技术)能够模拟真人发声,增强人机交互。XFS5051CE是科大讯飞公司研制的高集成度语音合成芯片。它能够准确,流畅地将文本合成语音,支持中英文的合成,并且拥有多种播音风格。本课题运用软件工程提供的设计思路,使用语音合成芯片XFS5051CE,针对广播管理,设计解决方案, 而能够把大量的工作人员从繁重的播音工作中解脱出来。   【关键词】语音合成芯片XFS5051CE 文本-语言转换技术 广播任务管理   智能语音技术的研究以语音识别技术为开端,让计算机接受、识别和理解言语信息,并将其转化为文本信息或命令,实现了人机交互的输入;语音合成技术的发展实现了将文本信息自动转换成语言信息,实现了人机交互的输出。语音合成技术在电信、交通运输以及银行等领域的语音广播中得到了广泛的应用,在传统的商业领域中,经常要定时或者循环播放一些通知、广告、找人等文稿,为此需要专业的播音人员;而播音人员素质参差不齐,播音过程中会出现口误,有些定时播音任务播音人员又不能做到准确。在传统的解决方法中,使用纯软件实现,语音的合成通过调用本地计算机上的语音库实现,导致系统运行速度较低;   随着半导体技术和计算机技术的飞速发展, 语音技术也在不断取得突破, 尤其是语音合成技术正在日臻完善, 新型语音芯片不断涌现, 科大讯飞是中国语音产业界迄今唯一上市公司,其智能语音核心技术代表了世界的最高水平。科大讯飞生产的XFS5051CE芯片就是语音处理方面非常优秀的产品。   1 系统总体设计   该智能语音系统包含硬件模块和软件模块,两个模块之间通过串行UART通讯。硬件模块的主要功能是完成语音合成,软件模块的主要功能就是实现播音任务的添加、修改;播音文稿的增删改查;用户管理等。系统的设计方案如图1所示:   2 硬件电路的设计   该硬件电路的设计是以XFS5051CE芯片为核心设计的。该硬件电路的主要功能就是将上位机发送的文本信息转换为音频信号并输出。用户在上位机的软件系统中输入文稿信息,通过串口发送至语音处理芯片XFS5051CE,文本信息被芯片中TTS语音合成模块处理,生成对应的音频信号,最后输出音频信号。   2.1 XFS5051CE芯片的介绍   XFS5051CE 是科大讯飞基于其全球领先的语音合成技术,推出的一款功能集成度最高的语音合成芯片。芯片可实现中文合成、英文合成、中英文混读,还支持粤语、四川话、湖南话等6种方言的合成;芯片可配置为导航模式,导航模式下,全国的地名路名的专有读法、生僻字的读法更加准确;芯片对特殊格式的天气预报进行了定制,播报的语音更加地亲切自然;同时芯片集成了语音编解码功能,可以进行录音和播放。   该芯片是LQFP100封装,引脚如图2所示,主要引脚的功能如表1所列。   图2:芯片引脚   XFS5051CE 语音合成芯片的主要功能特性如下:   2.1.1 支持多种风格的中文、英文、方言的发音   10 个中英文双语发音人:可以支持中文(普通话)合成、英文合成和中英文混读。3 个纯英文发音人:为美式英语的发音风格,可用于纯英文文本的合成。7 个方言发音人:支持6 种方言的合成,7 个方言发音人分别为是粤语男声、粤语女声、四川女声、东北女声、台湾女声、湖南男声、河南男声。   2.1.2 可进行语音的编解码   芯片内部集成了语音编码单元和解码单元,可以进行语音的编码和解码,实现录音和播放功能。芯片的语音编解码具备高压缩率、低失真率、低延时的特点,并且可以支持多种语音编码解码速率。这些特性使它非常适合于数字语音通信、语音存储以及其它需要对语音进行数字处理的场合。如:车载微信、指挥中心等。   2.1.3 文本合成功能   芯片支持任意中文文本的合成,可以采用GB2312、GBK、BIG5 和UNICODE 四种编码方式。每次合成的文本量最多可达4K 字节。   2.1.4 支持多种控制命令   控制命令包括:合成文本、停止合成、暂停合成、恢复合成、状态查询、进入省电模式、唤醒等7 种控制命令。控制器通过通讯接口发送控制命令可以对芯片进行相应的控制。   2.1.5 查询芯片的工作状态   支持多种方式查询芯片的工作状态,包括:查询状态管脚电平、通过读芯片自动返回的工作状态字、发送查询命令获得芯片工作状态的回传数据。   2.2 芯片与PC上位机通讯电路的连接   XFS5051CE芯片可以选择PC、单片机作为上位机,在本系统中采用PC机作为上位机,XFS5051CE 芯片与PC 通过UART 串口相连,需

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档