- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音识别技术
计科1111
时间:2013年11月1日
制作人:孟傲、韩园、严赟
(1)语言是人类特有的功能,声音是人类常用的工具,是相互传递信息的最主要的手段。
(2)语音和语言与人的智力活动密切相关,是人们构成思想疏通和感情交流的最主要的途径。
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。
讲解重点:
1. 语音识别的重要性
2. 语音识别的定义、原理和分类
3. 语音识别的历史回顾
4. 语音信号处理简介
5. 语音技术概述
1语音识别的重要性
语音信息处理
人类利用语言相互交流信息,包括语音和文字两种表达方式。通过语音相互传递信息,这是人类最重要的基本功能之一。随着信息社会的发展,人与人之间,人与机器之间也需要进行大量的信息交换。
计算机语音识别是智能计算机系统的重要特征。这一技术的应用将从根本上改变计算机的人机界面,从而对计算机的发展以及推广应用产生深远的影响。
语音识别的重要性
语音识别是一项具有巨大应用推广前景的工程
基于电话的语音识别技术,使计算机直接为客户提供金融证券和旅游等方面的信息查询及服务成为可能,进而成为电子商务中的重要一环(Voice-Commerce)。
语音识别技术作为声控产业,对编辑排版、办公自动化、工业过程和机器操作的声控技术起到重大的推进作用。可以预言,语音技术必将对工业、金融、商业、文化、教育等诸方面事业产生革命性的影响。
主要先进国家都将此工程列为国家级研究项目
面对如此广阔的应用领域,目前国内外众多公司正 积极推动语音识别技术的应用。
微软:让计算机能说会听
IBM:ViaVoice仍居主流
Intel:做语音技术倡导者
微软:让计算机能说会听
Bill Gates 在97年世界计算机博览会(COMDEX)主题演讲会上描绘IT事业的发展宏图时指出:
下一代操作系统和应用程序的用户界面将是语音识别。工业界应对语音识别领域的重大突破做好充分准备,因为那将是一场席卷全球的另一次热潮。
1998年11月5日,微软中国研究院在北京成立。该中心的任务是重点研究计算机在中文环境下的易用性。
IBM:ViaVoice仍居主流
IBM公司潜心研究语音识别技术迄今已达30年之久,投资超过2亿美元。
IBM公司于1995年在北京成立了中国研究中心,中文语音信息处理成了该中心三大研究领域之一,并于1997年9月4日,在北京推出了中文连续语音识别产品ViaVoice。
Intel:做语音技术倡导者
1998年,英特尔公司也宣布致力于推广语音识别技术,除了在北京举办首届语音技术国际论坛之外,还在北京、上海、成都、广州等地展开了“基于英特尔框架的语音识别技术”的宣传活动。
联合了七家世界著名学术机构(中科院自动化所、清华大学、香港科技大学、香港中文大学、麻省理工学院、俄勒岗研究院、WATERLLOO大学)成立了“国际语音技术研究组织”,致力于计算机语音技术的基础研究,以加速中文语音识别技术的发展。
2.1语音识别的定义
语音识别是研究如何采用数字信号处理技术自动提取以及决定语音信号中最基本、 最有意义的信息的一门新兴的边缘学科。它是语音信号处理学科的一个分支。
语音识别所涉及的学科领域:信号处理、物理学(声学)、模式匹配、通信及信息理论、语言语音学、生理学、计算机科学(研究软硬件算法以便更有效地实现用于识别系统中的各种方法)、心理学等。
音韵信息与音律信息
有意义、有内容的信息是构成语音音韵特性、即语音的共性特征之基础,这类特征信息称为音韵信息。
语音信号中有关个人特征的信息、即语音的个性特征,如:音强、节奏、音高等,这类特征信息称为音律信息。
从广义上讲,语音识别也包括了对说话人的识别,其主要内容是提取语音信号中有关个人特征的信息、即语音的个性特征(如:音律特性等),在这里专指有意义、有内容的识别。
2.2 语音识别的基本原理
训练(Training):预先分析出语音特征参数,制作语音模板(Template)并存放在语音参数库中。
识别(Recognition):待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,得出识别结果。
失真测度(Distortion Measures):在进行比较时要有个标准,这就是计量语音特征参数矢量之间的“失真测度”。
主要识别框架:基于模式匹配的动态时间规整法(DTW:Dynamic Time Warping)和基于统计模型的隐马尔柯夫模型法(HMM:Hidden Markov Model)。
语音识别原理框图
图 语音识别的实现
不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个
您可能关注的文档
- 新人教版初中物理《家庭电路》复习绪论.ppt
- 应用光学复习第一章概念.ppt
- 智班希沃交互智能平板初级培训试题.ppt
- 智多星水利水电工程概预算工程软件基础操作试题.ppt
- 应用平衡移动原理问题概念.ppt
- 新人教版第三节世界最大的黄土堆积区-黄土高原绪论.ppt
- 应用文常见病例概念.ppt
- 佣金之访后付佣概念.pptx
- 新人教版第四节噪声的危害和控制绪论.ppt
- 新人教版第四章第五节光的色散雷寨中学绪论.ppt
- 2025北京政法职业学院招聘7人考前自测高频考点模拟试题及参考答案详解.docx
- 2025四川九州光电子技术有限公司招聘法务审计部副部长考前自测高频考点模拟试题及完整答案详解1套.docx
- 2025中国建筑一局(集团)有限公司政策研究岗招聘1人考前自测高频考点模拟试题参考答案详解.docx
- 2025“粤聚英才粤见未来”广东云浮市中医院人才招聘28人模拟试卷及答案详解1套.docx
- 2025四川泸州发展控股集团有限公司及旗下企业春季招聘45人考前自测高频考点模拟试题带答案详解.docx
- 2025四川九洲电器集团有限责任公司招聘试验工程师考前自测高频考点模拟试题带答案详解.docx
- 2025内蒙古巴彦淖尔市能源(集团)有限公司招聘48人考前自测高频考点模拟试题及参考答案详解.docx
- 2025光明乳业股份有限公司郑州招聘(河南)考前自测高频考点模拟试题及参考答案详解一套.docx
- 2025云南省消防救援总队训练与战勤保障支队招聘(5人)考前自测高频考点模拟试题附答案详解.docx
- 2025中央和国家机关工委所属事业单位招聘7人考前自测高频考点模拟试题附答案详解.docx
文档评论(0)