- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
智能语音行业研究报告
一、智能语音:谈入口太早,但不可或缺
智能音箱是台面上的狂欢,本质还在用户、数据和服务
自2014年11月Amazon推出收款基于语音交互的智能音箱Echo以来,2015年科大讯飞发布智能音箱叮咚,2016年谷歌发布智能音箱Google Home。
而进入2017年以后更是密集,5月联想发布智能音箱,Amazon发布带触屏的Echo Show,微软联手音频设备制造商哈曼.卡顿合作打造Invoke,6月苹果发布HomePod。同时国内BAT等互联网巨头也纷纷有意入局。
智能音箱本身不是目的,争夺的是背后的用户、数据以及服务入口。其实基于语音交互技术的入口产品可以是音箱、电视等家居产品,甚至可以是室内可及的智能设备,之所以选择音箱作为突破口,只不过看重这样一款在初期能承担除交互之外其他功能的载体。
对于用户而言,需要的是能够将众多繁杂的应用和接口进行封装的工具,不再需要自己主动到每一个具体应用上获取服务,而是借助语音交互统一的入口提供。对于巨头公司而言,目的在于借此获得移动互联网之后一个能够获取用户数据并持续提供服务的入口。
单就智能音箱而言,交互体验和连接的服务是影响用户选择的重要因素。抛开智能音箱的设定,其本质是一款基于语音进行人机交互的智能硬件,在算法层面涉及到降噪、远场识别、唤醒与打断以及多轮会话、语义分析等自然语言理解技术,硬件层面主要涉及到进行声音采集的麦克风阵列技术以及声音播放时扬声器处理。软硬件的协同配合方能使得人机交互更为自然。
如果说播放音乐是传统音箱的主要功能,那么对于智能音箱而言,这已经几乎成为附带选项,互相之间拼的不是、或者说不只是音质问题,更多是人机交互的体验,以及交互背后所能支撑和兼容的服务数量与质量。无论是对接线上的互联网服务,还是线下智能家居系列产品,若无法形成产品、应用以及数据的生态闭环,则智能音箱的入口目标就难以达成。
国内智能音箱的惨淡销量还与消费习惯相关,用户培育需要时间。与Amazon Echo千万量级销量相比,国内科大讯飞与京东联合发布的叮咚音箱销量似乎逊色不止一筹。除了在技术和应用层面可能存在的差异之外,各自根植的土壤环境也有着先天的差异。
若去掉“智能”的概念,智能音箱首先是个音箱,与欧美超过85%的家庭音箱普及率相比,国内甚至不足20%,在对音乐以及音箱设备的需求观念上的差异导致音箱对欧美人群或许是“生活刚需”,而对国内用户或许目前还只是少部分人的爱好。正如前文所述,音箱只是恰好成为载体之一,最核心的依然是物联网时代智能终端的人机交互入口。
信息获取与表达决定语音交互成为阶段性不可或缺的一环
互联网PC时代人机交互主要依赖鼠标和键盘,移动互联网时代触摸屏交互成为标配,那么人工智能时代的交互会由哪种方式主宰?基于语音控制的智能音箱还是智能电视?
这些或许有可能成为智能家居入口,但即便Amazon Echo已然达到千万级销量及超过1万项技能点,似乎也不足以成为人工智能时代交互入口的产品担当。
从信息获取以及表达的角度来看,交互入口的演变必然是从习惯到本能的革命。从信息获取来看,研究表明,人的各种感觉器官从外界获取信息来源=视觉60%+听觉20%+触觉15%+味觉3%+嗅觉2%。
其中视觉、听觉及触觉累计高达95%,基于此或许就不难理解为何无论是互联网时代的PC还是移动互联网时代的智能机,不仅无法离开键鼠套装和触摸传感器,而且还无法离开那块或大或小的显示屏。
从信息表达来看,1967年美国著名心理学家、传播学家艾伯特梅拉比安等人经过大量实验,提出人类在沟通中全部的表达信息=肢体语言信息55%+声音信息38%+语言信息7%,或许这也能在一定程度上解释为何各家智能音箱先后登场却依然未能挑起入口大梁。
我们认为,从键鼠输入的抽象符号到触摸屏直接的滑动与按压,这已经在一定程度上靠近了人类习惯,而未来的交互方式将更为接近人的本能。
语音或许是人机交互的阶段性成果,基于语音的人机交互或许会成为某个特定场景的入口,但语音与肢体动作的融合或许更可能担当得起一个时代的交互入口,至于更为遥远的未来,或许会有类似脑电波等其他方式。
二、智能语音相关技术及发展历史
智能语音主要研究人机之间语音信息的处理和反馈问题,从表现形式来看,即研究如何通过语音实现人机交互,相关支撑技术主要可划分为基础语音技术、智能化技术以及大数据技术。
语音识别准确率在引入深度学习之后得到快速提升。语音目标在于使机器最终能够将识别语音中的内容、说话人、语种等信息。在技术思路经历了基于标准模板匹配和基于统计模型(HMM)两个阶段;
2010年开始由微软的俞栋、邓力等与Hinton合作,在语音识别领域引入深度学习替换传统的特征提取,随着深度学习的引入以及在此基础上派生的各类模型的组合,语音识别准确率大幅提升。
2017
您可能关注的文档
最近下载
- 《气瓶安全技术规程》.pdf VIP
- 敦煌文学艺术_浙江师范大学中国大学mooc章节课后测试答案期末考试题库2024年.docx VIP
- 调整公办高校本科学费标准政策解读-河北物价局.PDF
- 2025中国船级社人才招聘50人笔试历年参考题库附带答案详解.docx
- 学堂在线 数据结构(上) 章节测试答案.docx VIP
- 绿色工厂管理组织结构成立及职责(制作公司正式红头文件,主要修改标颜色部分,其它部分可据实调整).doc VIP
- 人教版高中数学A版 必修第1册《第三章 函数的概念与性质》大单元整体教学设计.docx
- 焊接及热切割作业初训.ppt
- 匡文波版《手机媒体概论》(2025年版)期末模拟试题(四).pdf VIP
- 学堂在线 唐宋词鉴赏 期末考试答案.docx VIP
原创力文档


文档评论(0)