智能语音助手行业成功案例分析.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1中国智能语音助手行业发展背景中国智能语音助手用户研究2咪咕灵犀案例分析3人工智能行业发展现状语音识别、计算机视觉领域取得重大进展在20世纪50年代到70年代初,人工智能的研究尚处于“推理期”,人们认为如果赋予机器逻辑推理能力,机器就能具有 智能。到了20世纪70年代,人们意识到人类之所以能够判断、决策,除了推理能力之外,还需要具备一定的知识。发展到 20世纪80年代,机器学习真正成为一个独立的学科领域,相关技术层出不穷。2010年后,“人工智能”相继在语音识别、 计算机视觉领域取得重大进展,围绕语音、图像等人工智能技术的创业大量涌现。人工智能行业发展历程DENDRAL—世界上第一例成功的专家机器学习期深度学习在语音及 图像领域大获成功推理期将逻辑推理能力 赋予计算机系统第五代计算机项目由 于技术路线明显背离 计算机工业的发展方 向而宣告失败系统诞生早期的系统适用 于更宽的选择和 更难的问题时效 果并不理想20122014195619632006莱斯利提出 概率近似正 确模NN超第二名十 个百分点夺特茅斯会议诞 生了“人工智能 科学”ImageNet港中文实验室DeepID 算法首次超过人眼识 别人脸率自动定理证明系统 完成数学原理第二 章的证inton发表深 度学习的 Nature文章美国科幻巨匠阿西 莫夫提出“机器人 三定律”AlphaGo战 胜人类顶尖围 棋选手知识期总结人类知识 教授给计算机系统人工智能分类虚拟语音助手是人工智能的重要应用领域计算机视觉、智能语音和机器学习是人工智能的三大核心基础技术,目前研发出的人工智能应用大多是这三种技术综合运 用的结果,只是其中的主次之分不同。依据核心基础技术类目,可以将人工智能分为两大类,即感官智能和决策智能,其 中视觉智能、语音智能和深度学习智能是感官智能和决策智能下的三大子赛道。目前,语音智能的一个重要行业应用就是 虚拟助手,即“智能语音助手”。它的核心在于人类通过纯语音信息实现与机器的交互,让智能机器“助手”帮忙完成指派的任务。人工智能行业分类感官智能决策智能视觉类计算机视觉目前主要应用于辅助驾驶、 图像/视频编辑、图片识别、 人脸识别、文字识别、视频 监控、工业视觉检测、三维 视觉、医疗影像诊断等。来源:艾瑞咨询研究院自主研究并绘制。语音类智能语音目前主要应用于智能家居、 虚拟助手、可穿戴设备、智 能车载、智能医疗、陪伴机 器人等。深度学习类机器学习目前主要应用于精准营销、 风险预估、健康监测、优化 运营、AlphaGo等。智能语音助手行业现状互联网巨头纷纷进入布局从2010年开始,互联网巨头们纷纷通过自主研发或并购/参股的方式开始探索智能语音产业,其中,智能语音虚拟助手成 为重点布局对象,此外,为占据一定的市场先机,苹果、谷歌、微软、亚马逊、百度、腾讯、搜狗等巨头们也陆续开始在 智能车载、智能家居、智能医疗、可穿戴设备等诸多细分市场寻求突破。智能语音技术及其发展语音识别、声纹识别、语音合成等人类因为具有语言的能力而区别于其他物种,智能语音技术即研究人与计算机直接以自然语言的方式进行有效的沟通的各 种理论和方法,涉及机器翻译、阅读理解、对话问答等,因为语言在词法、句法、语义等不同层面的不确定性及数据资源 的有限性、背景知识的复杂性等各方面限制,智能语音技术仍有非常大的提升空间,仅在特定领域可取得较好的应用,鲁 棒性存在大量挑战。在自然语言处理之前,声纹识别可根据说话人的声纹特征识别出说话人,语音识别技术可赋予机器感 知能力(在深度学习的驱动下,目前近场语音识别准确率可达98%,远场、抗噪、多人等非限定或配合条件下的识别有待 改进),将声音转为文字供机器处理,在机器生成语言之后,语音合成技术可将语言转化为声音,形成完整的自然人机语 音交互,这样的语音交互系统可看作一个虚拟对话机器人,具体流程如下。智能语音交互系统的技术流程ASR语音识别NLU语音理解DST对话状态维护1234对话输入TTS语音合成NLG语音生成Policy动作候选排序8765对话输出语音NLP智能语音产业图谱四大板块协同作业智能语音产业链分为基础研究机构、语义数据提供商、语音技术提供商及智能语音应用提供商四大板块。其中,基础研究机构包括语音合成、语音识别、声纹识别等基础技术的研发和技术输出;语义数据提供商为算法研究和技 术输出机构提供语音、语义数据库及定制化的数据采集和处理;语音技术提供商将基础技术转化为软件或行业整体解决方 案,提供嵌入式或平台是的语音软件服务、行业智能语音系统整体解决方案;智能语音应用提供商则有智能移动设备、智能车载设备、智能家居等智能终端厂商,以及输入娱乐等各类APP或软件客户端等。2018年中国智能语音助手产业图谱基础研究机

文档评论(0)

阿要辣油 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档