- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能与信息社会
人工智能应用:语音识别——个人助理
陈斌北京大学gischen@pku.edu.cn
语音识别技术
〉 语音识别技术,也被称为自动语音识别
Automatic Speech Recognition(ASR),
其目标是将人类的语音中的词汇内容转换为
相应的文字。
北京大学地球与空间科学学院/ 陈斌/2018
语音识别基本原理
〉 我们知道声音其实是一种波,如果要对于声
音进行分析,就需要对于声音进行分帧。
〉 也就是把声音按照时间切成若干个小段,每
一小段称为一帧。
北京大学地球与空间科学学院/ 陈斌/2018
语音识别基本原理
〉 单词的发音由音素构成。音素是语音中的最
小的单位,依据音节里的发音动作来分析,
一个动作构成一个音素。
〉 对英语,一种常用的音素集是卡内基梅隆大
学的一套由39个音素构成的音素集。汉语一
般直接用全部声母和韵母作为音素集。
〉 状态:比音素更细致的语音单位。通常把一
个音素划分成3个状态。
北京大学地球与空间科学学院/ 陈斌/2018
语音识别基本原理
〉 1、语音分帧 2、声学特征提取
〉 3、把帧识别成状态 4、把状态组合成音素
〉 5、把音素组合成单词
北京大学地球与空间科学学院/ 陈斌/2018
语音识别基本原理
〉 每个小竖条代表一帧,若干帧语音对应一个
状态,每三个状态组合成一个音素,若干个
音素组合成一个单词。
〉 一般认为某帧对应哪个状态的概率最大,那
这帧就属于哪个状态。
北京大学地球与空间科学学院/ 陈斌/2018
神经网络在语音识别中的应用
〉 通过巨大数量的语音数据,经过神经网络监
督训练得到 “声学模型”。
〉 通过声学模型里的参数,就可以知道帧和状
态对应的概率。
北京大学地球与空间科学学院/ 陈斌/2018
神经网络在语音识别中的应用
〉 神经网络不仅可以编码
最近的几个词,还可以
把前文中的所有词 (称
作 “历史”)中的各种
信息都作为输入特征。
〉 由于历史是一个序列,
可以采用递归神经网络
(RNN)来建立声学模
型。
北京大学地球与空间科学学院/ 陈斌/2018
语音识别应用
〉 语音识别技术的应用包括语音拨号、语音导
航、室内设备控制等。
〉 语音识别技术与其他自然语言处理技术如机
器翻译及语音合成技术相结合,可以构建出
更复杂的应用,例如同声传译。
北京大学地球与空间科学学院/ 陈斌/2018
语音识别应用:语音输入法
〉 通过语音识别输入文字,最高速度能够达到
1分钟400字,比普通键盘输入更加高效。
〉 科大讯飞的语音输入,不仅支持中文录入、
中文转英文等功能,还支持粤语、四川话、
东北话、上海话、闽南语等多种方言输入。
北京大学地球与空间科学学院/ 陈斌/2018
语音识别应用:个人助理
北京大学地球与空间科学学院/ 陈斌/2018
语音识别应用:个人助理
〉 小冰是微软推出的一个人工智能聊天机器人,
已经可以创作诗歌、撰写新闻、主持节目,
已在北京人民广播电台开播节目。
〉 无论从用户数量、活跃度还是交互流量来看,
微软小冰均是目前全球最大规模流量的对话
式人工智能产品。
北京大学地球与空间科学学院/ 陈斌/2018
语音识别应用:个人助理
〉 Siri是一款内置在苹果iOS系统中的人工智能
助理软件。
〉 利用自然语言处理技术,用户可以使用自然
的对话与手机进行交互,完成搜索数据、查
询天气、设置手机日历、设置闹铃等许多服
务。
北京大学地球与空间科学学院/ 陈斌/2018
语音识别应用:个人助理
〉 Google Assistant 结合了谷歌积累多年的
技术,其 “持续性对话”功能让机器与人的
交流更为自然。
〉 智能语音助手和搜索引擎是相辅相成的,更
聪明的搜索逻辑能够更快的帮助用户找到答
案。
北京大学地球与空间科学学院/ 陈斌/2018
您可能关注的文档
- 人工智能与信息社会课件:201 什么是人工智能.pdf
- 人工智能与信息社会课件:202 第一次热潮.pdf
- 人工智能与信息社会课件:203 人工智能经典问题.pdf
- 人工智能与信息社会课件:204 第二次热潮.pdf
- 人工智能与信息社会课件:205 第三次热潮.pdf
- 人工智能与信息社会课件:206 人工智能的发展.pdf
- 人工智能与信息社会课件:301实例1:读心术(建立二分查找的规则).pdf
- 人工智能与信息社会课件:302和人类一样的判断方式:专家系统.pdf
- 人工智能与信息社会课件:303专家系统应用与发展.pdf
- 人工智能与信息社会课件:304实例2:井字棋(决策树介绍).pdf
- 2022年高考物理一轮复习配套习题:选修3-2 第十章 专题突破.pdf
- 2022年高考物理一轮复习配套习题:选修3-3 第1讲.pdf
- 2022年高考物理一轮复习配套习题:选修3-3 第2讲.pdf
- 2022年高考物理一轮复习配套习题:选修3-3 第3讲.pdf
- 2022年高考物理一轮复习配套习题:选修3-4 第1讲.pdf
- 2022年高考物理一轮复习配套习题:选修3-4 第2讲.pdf
- 2022年高考物理一轮复习配套习题:选修3-4 第3讲.pdf
- 2022年高考物理一轮复习配套习题:选修3-4 第4讲.pdf
- 2022年高考物理一轮复习配套习题:选修3-5 第六章 第1讲.pdf
- 近发展起来的新算法.ppt
文档评论(0)