语音信息处理ppt.pptVIP

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信息处理ppt

语音信号处理 Speech Signal Processing 金赟 江苏师范大学物电学院 第一讲 绪论 1.语音信号处理的概念 2.语音信号处理的学科基础 3.语音信号处理的分支和应用 4.语音信号处理的发展历史 5.本课程的内容和特点 6.参考书目 7.学习要求 1.语音信号处理的概念 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。 2.语音信号处理的学科基础 3.语音信号处理的分支和应用 语音识别 语音合成 语音编码 说话人识别 3.1 语音识别 (1)语音识别研究的目的就是研究出一种具有听觉功能的机器,能直接接受人口呼的命令,理解人的意图,并做出相应的反应。 语音识别的应用 语音识别技术在信息处理领域的首要的巨大应用将在于提供了一种全新的人机交互形式。 苹果的Siri。 Siri恶搞,国人Siri,Siri惊魂,Siri日式英语。 语音输入法。 语音识别的分类 针对说话人:特定说话人语音识别和非特定说话人语音识别 针对词汇量:小词汇量、中词汇量和大词汇量的识别 针对说话方式:孤立词识别和连续语音识别 针对识别环境:实验室环境语音识别、电话语音识别和广播语音识别 语音信号和自然语言的多变性和复杂性 (1) 连续语音词与词之间没有明显的停顿,词与词之间的 分割比较困难; (2) 每一个基本的声学识别基元(如音素)受前后音素发 音方式的影响(协同发音)使特征变得不稳定 (3) 不同人、不同心理和生理以及在不同的说话环境下说 同一词时,声学信号特征会发生变化; (4) 一个词的读音不仅包含了词义特征,而且还包含了说 话人性别、年龄、情绪等大量与词义无关的信息,而 这些信息的分离是不容易的。 (5) 自然语言的多变性难以借助于一些基本语法规则进行 描述,因而使计算机编程变得困难。 (6)语音信号往往受到其他信号的干扰和信道的影响。 3.2 语音合成 语音合成是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的口语输出的技术。 (让电脑说话) 语音合成的应用 1.海量信息查询类业务 大部分海量信息如考试查分、征婚启事、人才信息、电话广告等,由于其内容庞大,往往无法在短期内完成录音,即使可以事先录音,也需要很长的制作周期,而且在量大的时候肯定会出现人为错误;采用语音合成技术可以节约大量人力,缩短开发周期,而且能够完全保证了所有信息100%正确。 2.动态信息查询类业务 声讯节目逐渐地由现在娱乐型节目为主的节目构成转向以应用型的节目为主,而多数的应用类节目对实时性要求比较高,如证券行情、订票、订房等,上述应用中动态信息不可能事先录音,需要实时地从数据库中读取,动态进行语音合成,保证信息的实时性。 自动报时、报警、公共汽车或电车自动报站 打印出版过程中的文本校对。 电子函件及各种电子出版物的语音阅读。 列车惊魂,语音合成配音 Tom猫咆哮体 马丁路德金演讲 大脑扫描,语音合成 语音合成的例子(霍金) 不能说话和做手势,如何演讲写字? 在霍金的眼镜上,约距右颊一英寸处,安装了负责侦测肌肉活动的红外线发射器及侦测器,譬如他想打招呼,说声你好,他先以眼球控制红外线感应器,选定在屏幕上轮流出现的英文字母,当计算机出现他想要的H时,霍金再动眼球,这样计算机就会不断显示以H为字头的英文字,当HELLO出现时,他又动一下以选定这个字,当他造句完毕后,才把句子传至合成器发声。因此霍金要说一句话,就要逐字逐句输入计算机,再由语音合成器将文字化成声音,一分钟只能处理3-5个字。 科大讯飞语音合成在线演示 /ttsdemo/interPhonicShow.aspx 3.3 语音编码 语音编码的研究目的是如何在尽量减少失真的情况下高效率地对模拟语音信号进行数字表达。 语音编码的应用 数字通信系统 移动无线通信 保密语音通信 3.4 说话人识别 说话人识别(声纹识别)可分为两种: 说话人辨认 说话人确认 目前,声纹识别已经在证券交易、银行交易、身份证、信用卡的认证等领域均有应用。在国外,声纹识别技术已经取得了较为广泛的应用。美国已把声纹识别用到保险、银行等行业,迪拜在交通管理上使用声纹验证来确认驾驶员身份,戴尔公司已经实施了声纹认证用于网上订购,菲律宾政府的养老金系统现在也可以通过声纹识别来完成身份认证。 在国内,声纹识别技术目前已广泛应用于嵌入式系统,同时其他方面的应用也逐渐兴起,如招商银行已经于2008年8月开始与以色列的PerSay公司进行声纹识别方面的项目合作。 声纹识别已成功应用在司法鉴定领域。利用声纹识别技术确定犯罪证据,如通过分析电话录音资料来确定犯罪嫌疑人的身份和

文档评论(0)

cangpu2515 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档