- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第二单元人工智能ABC
第十二课语音识别与翻译
学习目标知识导图
知道语音识别的概念。语音识别与翻译
了解语音识别系统及其原理。
了解语音识别的应用领域。语音识别与翻译
语音识别系统及其原理
语音识别的应用
随着科技的发展,人类陆续发明和制造了各种机器协助工作。尽管生
产力得到大大提高,但在这个阶段,人类仍然需要动手操作机器。为了真
正“解放双手”,科学家致力于研究怎样使机器更加智能化,变得能够听
懂人类的语言,可以按照人类的指令工作,甚至可以与人对话。而语音识
别与翻译技术,就是其中一项关键技术。
一、语音识别与翻译
语音识别是一门涵盖声学、语音学、语言学、信息理论、模式识别理
论和神经生物学等的综合性学科。语音识别技术就是让机器通过识别和翻
译把语音信号转变为相应的文本或指令的技术,并逐渐成为信息技术中人
机交互的关键技术。
自主探究
如图12-1所示,利用语音识别软件,用语音输入的方法,输入诗人
李白的《望庐山瀑布》:“日照香炉生紫烟,遥看瀑布挂前川。飞流直下
三千尺,疑是银河落九天。”由此体验语音输入的便捷。也可以尝试转换
93
信息技术九年级(全一册)
所使用的语言(如普通话、粤语、英语等),输入不同的内容,探究语音
识别的特点。
图12-1 语音识别输入文字
二、语音识别系统及其原理
1. 声音的本质
声音是由物体振动产生,并通过介质(空气或固体、液体)传播的一
种波,如图12-2所示。因此,对声音的识别就是对波信号的处理。
图12-2 声音波形
2. 语音识别系统
语音识别系统模型通常由声学模型和语言模型两部分组成,分别对应
语音到音节概率的计算和音节到字概率的计算。
(1)声学特征。
声学特征的提取与选择是语音识别的一个重要环节。声学特征的提取
既是信息大幅度压缩的过程,也是信号分析和划分的过程。
94
第二单元人工智能ABC
(2)语言模型。
语言模型主要分为规则模型和统计模型两种。其中,统计模型是用概
率统计的方法来揭示语言单位的内在统计规律。
(3)系统实现。
语音识别系统的实现,建立在大量数据训练的基础上,使系统生成能
准确地定义语音片段的识别基元。系统所需的训练数据规模与模型复杂程
度有关。
(4)稳健性与自适应。
语音识别系统的性能受许多因素的影响,包括不同的说话个体、说话
方式、环境噪音、传输信道等。要提高系统稳健性,就要提高系统克服这
些因素影响的能力,使系统在不同的应用环境、条件下保持性能稳定。自
适应的目的是根据不同的影响来源,自动地、有针对性地对系统进行调
整,并在运作过程中逐步提高性能。
三、语音识别的应用
语音识别能把语言转换成计算机可以处理和传播的数据,使计算机做
出人们所期望的反应。
1. 语音与文字转换
语音转换成文字的功能除了使人们日常交流、听写数据录入更加便
捷,还能帮助人们快速准确地记录发生的事情,如:法院庭审的发言笔录,
访谈、报告和会议的即时字幕,手术情况记录等。
2. 机器控制
语音识别技术能使机器直接识别语言的内容和语
义,并给予相应的反馈,实现相应的功能,如:自动
导航、设备操控、文档检索等。
某品牌
文档评论(0)