重庆市科技馆语音识别、语音合成技术展区暨展品设置方案.pdfVIP

重庆市科技馆语音识别、语音合成技术展区暨展品设置方案.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
重庆市科技馆语音识别、语音合成技术展区暨展品设置方案 姚稳 安徽省科技馆,合肥,230088 摘要2003年.袁馆应重庆市科协的要求。为拟建的重庆市科技馆常j订晨区方棠鼙展 品设置方案.考虑到与安徽省科技馆耆蓉密切合作关系的料太讯飞公霹在诗音奢威和语音识 别技术研发方面颇有建树,故与其合作为重庆市拜技馆拟订了语音识别、语音合成技术辰鼠量 展品设置方棠. 差键调 重庆科技馆语音识别 语音合成技术展区方案 一、项目背景 到与安徽省科技馆有着密切合作关系的科大讯飞公司在语音合成和语音识嗣技术研发方而颇有建树. 故与其合作为重庆市科技馆拟订了语音识别、语音合成技术展区鳖媵品设置方案.该方案经专家评审 获得了一致好评. 二、技术背景 近年来语音技术的研究和产品化都取得了长足的发展.由于国家863计划的大力支持.中霸在语音 技术方藤走在了世界的前沿.目莉中文语音合成技术和识舅4技术都已经进入实用阶段.全国已缀有 面软件、玩具,车载GPS、客户服务中心等备个行业和领域,并且在乎安保险、深圳发媵银行、联通、电信 等单位实现了超犬规模的应用. 让电脑理解人类的语言,让电脑跟人一样说话已经不疆是科幻片牛的故事了.这些都开始实实在在 发生在我们身边.但是绝大多数人对语音技术还是知之甚少。为了让人们尤其是青少年更多地了鳃中 国在语音技术方面的发展水平、亲身体验语音技术带来的神奇感受,在科技展馆展示语齑技术的戒果. 普及语音技术方筒的知识在当前显得尤为重要.同时.通过强诱中国研究机构在语音技术方面的成果, 也可以让观众树立起对于中国科技发展的自豪感和信心. 三、相关技术 (一)语膏合成技术(TTS) lo 语音合成,叉称文语转换(Text 多个学科技术.是中文信息处理领域的一项前沿技术,解决的主要阔隧就是如何将文字信息转化为可听 的声音信息,也即让机器像人一样开口说话.我们所说的。让机器像人一样开口说话”与传统的声音强 放设备(系统)有着本质的区剐.传统的声音回放设备(系统),如磁带录啻机,是逶过预先家制声膏然后 回放来实现“让机器说话”豹.这种方式无论是在内容,存傣、传输或者方便性、及时性等方面都存在很 ·70· 大的限稍.丽通过计算机语音合成则可以在任何时候将任意文奉转换成具有高自然度的语音,从而真 正实现让桃器。像人一样开口说话。. 具体原理见以下示意巨t 目蘸。我们已开发出高度自然的中文合成、中英文混读语膏合成产黠和广东话版本的语音合成 技术。 (二)语专识男q技术(ASR) 语音识别按术(Automatic S驴e睇h 可被谗算枫程序所识别的文字信息,从丽识别说话人的语老指令以及文字内容的技术. 语音识别是一门交叉学科,语音识剐正逐步成为信息技术中人桃交互豹关键技术.语音识潮技术与 语膏合成技术结合使人们能够甩掉键盘.通过语音命令进行操作.语膏技术应用已经成为当翦新兴 技术. 四、展示方案 语啬技术霹以应用在人们生话的方方面面,而作为科技馆的展品,则要求展示方法生动有趣,甄可 以壹观感受技术,又能较全磁地体现该种技术的优越性。基于以上原则,特制定语音合疵、语音识别技 术专项展区展示方案,以期对语音龠成、语音识别的索面应用技术进行较为垒面的展示. (一)具体展示方素 展聪人口。是两扁紧阿的智能大门.当观众刭来时t大门会向观众提出有关的问题.观众如果能正 确回馨,并喊出“芝麻开门”的口令.大门则徐徐打开l如回答有谟.粥大门紧闭,黼樽次对话.通过太九 与观众的对话过程。展示了语音的识别与合成技术. 进人展区太门,左边是一机器人.按照机器人胸前按钮上的提示,按动键钮,机器人会发出各阶段 人工台成的语言,向戏众展示了我阑人工智售语音合成技术的发展历程. 正对展区大门.则是一个标有世界各主要城市的大塑地球仪.当观众对蔚话筒说出其中一个城市 的名字.地球仪上耜膻的城市会发出闪烁的红光,并用人工合成语盲摄出该城窜此刻的准确时闯(上下 午、小时、分). 展区正面,是一幅大型投影屏幕,采用虚拟技术将一只卡通鹦鹉。乐乐”的巍体影像投射在上丽.

文档评论(0)

ww88866 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档