第5章多媒体通信系统中的关键技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音合成技术 实现的方式 录音/重放模式 利用数字信号处理技术,采用参数合成的方式来实现语音合成 语音合成的三个层次 从文本到语音 从概念到语音 从意向到语音 第三十页,共八十一页。 有限词汇的计算机语音输出 语音报时、公共汽车报站、叫号系统 基于语音合成技术的文语转化(TTS) 除了完成文字到语音的映射外,还要完成对书面文字的理解以及对语音韵律的处理 第三十一页,共八十一页。 文语转换技术 有声电子文档、信息电话查询系统、基于计算机的办公教学娱乐多媒体软件、嵌入式操作系统。。 包括文本分析、韵律生成、语音合成 文本分析:使计算机认识文字、如何发音、用什么发音 韵律生成:生成发声文本的韵律特征(声调、停顿等) 语音合成: 第三十二页,共八十一页。 § 6.7 专用语音合成硬件 第三十三页,共八十一页。 一个合成系统 第三十四页,共八十一页。 语音合成有着广阔的应用前景 它可应用于: 盲人计算机,电话信息查询,文本校对,专家系统的有声输出、火车站、飞机场的航班信息报告等领域。 有限词汇语音合成的应用 语音手表(闹钟)、玩具、教具 仪器/电器(打印机、微波炉) 有声信息发布 车站列车、机场航班信息发布 114的电话号码报出 办公系统中的有声信息 第三十五页,共八十一页。 § 6.8语音合成的应用 基于PC的办公、教学和娱乐等多媒体软件 声讯服务领域的智能电话查询,包括:股市查询、工商信息电话查询、电话银行等。 第三十六页,共八十一页。 语音合成技术的应用 工商信息电话查询系统 本系统的功能是让用户可以通过电话查询到某一企业在工商局的注册信息。用户主要通过输入注册号、统一代码或者企业电话号码等来查询相应的企业信息。科大讯飞公司与IBM公司合作,采用电话语音识别技术来实现语音选择。用户只需口述企业名称(包括带一定模糊概念的口述,如“科大讯飞”或“讯飞”均可识别),即可直接得到该企业的一系列信息。与过去的按键听取相比,不仅方便了用户,还从很大程度上提高了查询效率,节约了用户的宝贵时间。另一方面,查询结果除了可以通过电话直接听取外,还可通过传真机接收到相关企业的详细信息(包括图像信息)。 第三十七页,共八十一页。 语音合成技术的应用 电话银行系统 电话银行是一种金融电话服务,客户只要拨通专线电话,即可在语音提示下,享用查询、转账、挂失和更改密码等多项服务。目前,大多数电话银行系统都存在两大不足之处:(1)各种金额数目的报读不够流利、自然;(2)菜单选择通过按键完成,用户不便记忆,听语音提示较费时。 中科大讯飞公司开发的电话银行系统,通过采用与中国科大人机语音通信实验室合作研究的语音合成技术,有效地克服了上述第一个缺点,使金额数目的报读声音清晰、语流自然,避免了用户听错数目的可能,提高了用户的满意度。该公司正在与IBM合作,计划采用最新的电话语音识别技术来实现菜单的语音选择,使用户只要口述功能名(如“转账”、“查询余额”等),即可直接进入系统的服务流程,而不必层层听取语音提示再加按相应的键。这将极大地方便用户的使用,提高用户操作的准确度,并节约用户宝贵的时间。 第三十八页,共八十一页。 语音合成技术的应用 股市查询系统 目前,股民了解股市行情,主要通过以下方式: 电台、电视等媒体—不够实时与方便; 股票机 电脑等个人终端—需要硬件投资且有地点限制; 股票交易所的大屏幕、查询终端—要求用户亲临现场。 股市查询系统使用户只要通过普通双音频电话,即可随时得到最新的股市行情。用户拨通查询台,根据语音提示选择相应的功能,即可获得所需的各种股市信息。同时,如果采用电话语音识别技术来实现个股的语音选择,用户只要口述个股名称,即可直接得到该股票的最新行情,而不必通过按键输入代号,从而方便用户使用,并节约用户的时间。 第三十九页,共八十一页。 语音合成技术的应用 民航保单查询系统 语音合成技术可以起到很好的防伪效果。例如当旅客拿到一张民航保单时,如何确定它不是伪造的呢?他可以打电话到民航系统向服务小姐询问。语音合成技术完全可以取代服务小姐的工作,并提供更加快捷、准确的信息。旅客可以拨通某一个电话号码,在语音提示下,输入保险单号,则他就能听到用语音合成技术合成的该保单对应的航班号、被保险人姓名、乘机日期等语音信息,以验证该民航保单的真实性。根据电话号码的唯一性和语音合成技术的复杂性来确保民 航保单查询的可靠性。 第四十页,共八十一页。 语音合成的未来发展方向 (1)提高合成语音的自然度 (2)丰富合成语音的表现力 (3)降低语音合成技术的复杂度 (4)多语种文语合成 第四十一页,共八十一页。 1. 扫描仪 图形、图像等信息的主要输入设备 分类 手动式、平板

文档评论(0)

虾虾教育 + 关注
官方认证
文档贡献者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档