语音信号处理课件 胡航版 01章.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 信息社会语音应用契机 * 应用举例(嵌入式设备) * 应用举例(嵌入式设备) * Apple iPod Player * 应用举例(车载设备) * 应用举例(电信和企业) * 这门学科发展和应用已日益成熟,学习这门课程具有重要的现实意义 * 这门学科发展和应用已日益成熟,学习这门课程具有重要的现实意义 * * 如果不使用语言,而是单单使用某种信号来进行信息传递,要表示一个新的想法或是将某个事件进行组合并表示出来都是不可能的。 姿态是最不发达的传递信息的方法。用姿态可以表示“走”这一状态。可是要表示“今天将家里的狗赶走了”,“我打算明天走”,“想像 走时候的情景”等使用“走”这个词的地方很多,但是这些信息如果不用语言都无法表达。即使对“中午我吃的是羊肉串”这种简单的事件,如果不用语言也是无法表达的。此外,如“没发生什么事情”,“没有起床”这种具有否定含义的信息不用语言更加无法表达的。 * annotation注解, 注释Routine [计] 例行程序 * articulation[n] 说话, 表达, 清晰度Analog cassette模拟处理单元time scale [计] 时标 * 杜德雷 * 贝尔实验室的语言演示器VODER,那是最原始的语言合成器,问它一个问题,在一位女秘书操作下,它就说出回答 * 动态时间规正(DTW)方法是一种常用的校验算法,在非线性时间对齐的基础上给出两个签名间的距离并进行判决,这样做经验的成份较多,缺乏统计基础 * TTS的全称为Text To Speech,即“从文本到语音”。它是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。 音频编码有GSM、LPC-10、G.711、G.723.1、G.729 语音编码方法归纳起来可以分成三大类:波形编码、信源编码、混合编码。 MPEG4中码激励线性预测CELP(code excited linear predictive)音频编码器 多带激励(MBE)模型 corpus [n] 文集, 本金 trainable [adj] 可训练的 * 美国国防部高等研究计划局(DARPA) * SPHINX系统,美国卡内基梅隆大学著名的语音识别系统,早期的版本的设计者就是当代IT行业的知名人物——GOOGLE研究院的李开复博士 * SPHINX系统,美国卡内基梅隆大学著名的语音识别系统,早期的版本的设计者就是当代IT行业的知名人物——GOOGLE研究院的李开复博士 * 压缩代码指压缩编码的方法,例如1代表PCM * 盲人使用的上网软件包(阳光软件) * 1、语音信号的表示方式 2、语音信号的特点 3、TTS表示。。 * 80年代以来– 近代语音处理技术 ? 语音编码技术 – 1980年2.4kb/s LPC-10 – 1988年4.8kb/sCELP标准FS-1016,16kb/s REAL编码标准(欧洲) – 90年代2.4kb/s MBE – G系列Model Based Vocoder ? 语音合成 – 1980年Klatt 串/并联共振峰合成器 – 基于规则和波形拼接的合成--TD-PSOLA语音合成 – 基于统计大语料库的合成--Corpus based 语音合成方法 – Trainable TTS – HMM based 语音合成方法 * 80年代以来–近代语音处理技术 ? 语音识别 – 基于HMM框架的统计模式识别算法发展与工程化 – 80年代中期开始美国DARPA委托NIST组织的一系列评测,对语音识别研究发展重要的影响 – 语音处理技术产品化热潮 ? 1985年开始IBM大词汇英语听写机Tangora ? 90年代初Dragon Dictate70000词识别系统 ? 1988年无限词汇的中文听写机研制成功 – 90年代初开始 ? CMU的Sphinx非特定人连续语音识别系统 ? 1997年IBM推出的中文ViaVoice ? VLSI和计算机技术发展带来的巨大推动 * 二、语音处理的发展历史(国内) 在国内,语音处理方面有代表性的研究单位有:清华大学、中国科学院声学所、西安电子科技大学、四达公司、中国科学院自动化所、微软中国研究院等。 国内有关语音技术的产品分为两大类:语音合成技术和语音识别技术。 * 二、语音处理的发展历史(国内) 我国语音处理研究的起步比先进国家晚一点,但在跟踪国外先进技术基础上,进步很快。尤其在语音识别方面,成果突出,如研制成功汉语听写机产品。这是因为,由于汉语音节种类较少,结构很规则,便于以音节为基础实现无限词汇识别,因而很快获得了可与国际先进水平相比拟的成果。在语音合成方面,有限词汇的语音合成器已在自动报时、报警、

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档