语音识别(上 海 交通大学).ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音识别(上 海 交通大学)

语音识别基础 上海交通大学计算机系 吴亚栋 E-mail:ydwu@mail.sjtu.edu.cn Tel:第一章 绪论 1.1 语音识别的重要性 1.2 语音识别的定义、原理和分类 1.3 本课程的内容与要求 1.4 语音识别的历史回顾 1.1 语音识别的重要性 1.1.1 语音信息处理与语音识别 1.1.2 语音识别的重要性 1.2 语音识别的定义、原理及分类 1.3 本课程的内容与要求 本课程的内容 本课程的要求 参考书籍 1.4 语音识别的回顾 1.4.1 国外语音识别研究的历史 1.4.2 我国语音识别研究的历史 第一章 回家作业 调查报告: [国内外语音识别技术研究开发最新动态] 提交时间: 图1.1 人与人之间、人与机器之间的语音信息处理过程 计算机模拟人类交流信息的过程: *语音识别是一项具有巨大应用推广前景的工程 *主要先进国家都将此工程列为国家级研究项目 微软:让计算机能说会听 IBM:ViaVoice仍居主流 Intel:做语音技术倡导者 1.2.1 语音识别的定义 *音韵信息与音律信息 1.2.2 语音识别的基本原理 图1.2 语音识别原理框图 1.2.3 语音识别的分类 按识别器的类型: 按识别器对使用者的适应情况: 按语音词汇表的大小: 本课程的内容: 本课程的要求: 参考书籍: 1.4.1 国外语音识别研究的历史(1) 1.4.1 国外语音识别研究的历史(2) 1.4.2 我国语音识别研究的历史 *国外70年代所取得的实质性的进展 *国外80年代所取得的重大进展 *国外90年代所取得的实质性的进展 *70年代美国DARPA计划 *语音信号和自然语言的多变性和复杂性 *我国的语音识别技术的发展 特别是在电话语音识别方面,由于其有着广泛的应用前景,成了当前语音识别应用的一个热点。 另外,面向个人用途的连续语音听写机技术也日趋完善。这方面, 最具代表性的是IBM的ViaVoice和Dragon公司的Dragon Dictate系统。这些系统具有说话人自适应能力,新用户不需要对全部词汇进行训练,便可在使用中不断提高识别率。 CMU(卡内基梅龙大学)、MIT(麻省理工学院)、IBM、ATT等都参 与了这一计划的开发工作。 该计划执行的结果是1976年推出了HARPY(CMU)系统。虽然,这是有 限词汇和限定领域的识别系统,但改变了原来只利用声学信息的状况, 开始应用高层次语言学知识(如构词、句法、语义、对话背景等)。 在这为期10年的阶段中尽管所有的研究计划均未能达到预期目标, 但它对语音识别和理解研究的发展起了重要的推动作用。通过这一阶 段的研究使人们认识到语音识别任务的艰巨性,总结出许多有意义的 经验教训,并且从此对语音识别提出了许多基础性的研究课题。这些 课题主要涉及到语音信号和自然语言的多变性和复杂性*。 (1) 连续语音词与词之间没有明显的停顿,词与词之间的 分割比较困难; (2) 每一个基本的声学识别基元(如音素)受前后音素发 音方式的影响(协同发音)使特征变得不稳定 (3) 不同人、不同心理和生理以及在不同的说话环境下说 同一词时,声学信号特征会发生变化; (4) 一个词的读音不仅包含了词义特征,而且还包含了说 话人性别、年龄、情绪等大量与词义无关的信息,而 这些信息的分离是不容易的。 (5) 自然语言的多变性难以借助于一些基本语法规则进行 描述,因而使计算机编程变得困难。 (1)在北京有中科院声学所、自动化所、清华大学、北方交通大学等科研机构和高等院校。另外,还有哈尔滨工业大学、中国科技大学、四川大学等也纷纷行动起来。 (2)现在,国内有不少语音识别系统已研制成功。这些系统的性能各具特色。 - 在孤立字大词汇量语音识别方面,最具代表性的要数92年清华大学电子工程系与中国电子器件公司合作研制成功的THED-919特定人语音识别与理解实时系统。 - 在连续语音识别方面,91年12月四川大学计算机中心在微机上实现了一个主题受限的特定人连续英语---汉语语音翻译演示系统。 - 在非特定人语音识别方面,有清华大学计算机科学与技术系在87年研制的声控电话查号系统并投入实际使用。 * * 第一章 绪论 人类利用语言相互交流信息,包括语音和文字两种表达方式。通过语音相互传递信息,这是人类最重要的基本功能之一。随着信息社会的发展,人与人之间,自不必说,即使在人与机器之间也每时每刻都需要进行大量的信息交换。(图1.1) 计算机语音识别是智能计算机系统的重要特征。这一技术的应用将从根本上改变计算机的人机界面,从而对计算机的发展以及推广应用产生深远的影响*。

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档