人工智能与信息社会课件:706语音识别——个人助理.pdfVIP

人工智能与信息社会课件:706语音识别——个人助理.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能与信息社会 人工智能应用:语音识别——个人助理 陈斌北京大学gischen@pku.edu.cn 语音识别技术 〉 语音识别技术,也被称为自动语音识别 Automatic Speech Recognition(ASR), 其目标是将人类的语音中的词汇内容转换为 相应的文字。 北京大学地球与空间科学学院/ 陈斌/2018 语音识别基本原理 〉 我们知道声音其实是一种波,如果要对于声 音进行分析,就需要对于声音进行分帧。 〉 也就是把声音按照时间切成若干个小段,每 一小段称为一帧。 北京大学地球与空间科学学院/ 陈斌/2018 语音识别基本原理 〉 单词的发音由音素构成。音素是语音中的最 小的单位,依据音节里的发音动作来分析, 一个动作构成一个音素。 〉 对英语,一种常用的音素集是卡内基梅隆大 学的一套由39个音素构成的音素集。汉语一 般直接用全部声母和韵母作为音素集。 〉 状态:比音素更细致的语音单位。通常把一 个音素划分成3个状态。 北京大学地球与空间科学学院/ 陈斌/2018 语音识别基本原理 〉 1、语音分帧 2、声学特征提取 〉 3、把帧识别成状态 4、把状态组合成音素 〉 5、把音素组合成单词 北京大学地球与空间科学学院/ 陈斌/2018 语音识别基本原理 〉 每个小竖条代表一帧,若干帧语音对应一个 状态,每三个状态组合成一个音素,若干个 音素组合成一个单词。 〉 一般认为某帧对应哪个状态的概率最大,那 这帧就属于哪个状态。 北京大学地球与空间科学学院/ 陈斌/2018 神经网络在语音识别中的应用 〉 通过巨大数量的语音数据,经过神经网络监 督训练得到 “声学模型”。 〉 通过声学模型里的参数,就可以知道帧和状 态对应的概率。 北京大学地球与空间科学学院/ 陈斌/2018 神经网络在语音识别中的应用 〉 神经网络不仅可以编码 最近的几个词,还可以 把前文中的所有词 (称 作 “历史”)中的各种 信息都作为输入特征。 〉 由于历史是一个序列, 可以采用递归神经网络 (RNN)来建立声学模 型。 北京大学地球与空间科学学院/ 陈斌/2018 语音识别应用 〉 语音识别技术的应用包括语音拨号、语音导 航、室内设备控制等。 〉 语音识别技术与其他自然语言处理技术如机 器翻译及语音合成技术相结合,可以构建出 更复杂的应用,例如同声传译。 北京大学地球与空间科学学院/ 陈斌/2018 语音识别应用:语音输入法 〉 通过语音识别输入文字,最高速度能够达到 1分钟400字,比普通键盘输入更加高效。 〉 科大讯飞的语音输入,不仅支持中文录入、 中文转英文等功能,还支持粤语、四川话、 东北话、上海话、闽南语等多种方言输入。 北京大学地球与空间科学学院/ 陈斌/2018 语音识别应用:个人助理 北京大学地球与空间科学学院/ 陈斌/2018 语音识别应用:个人助理 〉 小冰是微软推出的一个人工智能聊天机器人, 已经可以创作诗歌、撰写新闻、主持节目, 已在北京人民广播电台开播节目。 〉 无论从用户数量、活跃度还是交互流量来看, 微软小冰均是目前全球最大规模流量的对话 式人工智能产品。 北京大学地球与空间科学学院/ 陈斌/2018 语音识别应用:个人助理 〉 Siri是一款内置在苹果iOS系统中的人工智能 助理软件。 〉 利用自然语言处理技术,用户可以使用自然 的对话与手机进行交互,完成搜索数据、查 询天气、设置手机日历、设置闹铃等许多服 务。 北京大学地球与空间科学学院/ 陈斌/2018 语音识别应用:个人助理 〉 Google Assistant 结合了谷歌积累多年的 技术,其 “持续性对话”功能让机器与人的 交流更为自然。 〉 智能语音助手和搜索引擎是相辅相成的,更 聪明的搜索逻辑能够更快的帮助用户找到答 案。 北京大学地球与空间科学学院/ 陈斌/2018

文档评论(0)

学习让人进步 + 关注
实名认证
文档贡献者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档