- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档,助力人生,欢迎关注小编!
风中飘来“语音云”
打开文本图片集
一则荣威车主“调戏”iVoka的视频在网上流传甚广——iVoka是荣威350上装配的语音云驾驶系统——当车主对着iVoka说“我爱你”的时候,iVoka不无醋意地表示“这句话你也对Siri说过吧”,车主只好无奈认栽。
事实上,对于iVoka这种全新的智能语音人机交互装置,逗趣唠嗑只是其“副业”,连接豆瓣点播音乐、查天气、查股票、查航班、查实时新闻资讯等等,才是它的正经功能——在这一应用背后,是一家叫科大讯飞的公司所提供的语音技术。
2020年3月22日,北京国家会议中心,科大讯飞“新一代语音云平台”发布会现场。科大讯飞CEO刘庆峰拿出一部智能手机,开始演示公司开发的新应用“讯飞语点”。他用自己的声音命令手机发短信、安排日程、查找餐馆,还不忘调侃手机:“你能做什么”?手机回答道:“我正在反思自己的不足。”现场立刻笑声一片。
一切都像极了当年由乔布斯掌控的苹果产品发布会现场。
苹果公司的Siri大热,将语音技术的消费应用提到了日程上,各行各业都在挖掘自己和语音的结合点;而像科大讯飞这样的语音技术提供商则希望在更广泛的消费应用方面和不同的开发商合作,找到更广阔的天地。
移动引爆语音
人们对下一代语音交互方式的美好畅想,从来就没有停止过。不过,在很长一段时间内,语音技术被看成是鸡肋:弃之可惜,食之无味。微软、谷歌、IBM,这些世界级的IT巨头,一直在语音技术商用方面努力探索。然而,前景虽然很美好,语音技术却始终无法实现大规模民用。
“我当年在微软工作的时候,曾听到比尔·盖茨说: ‘语音技术在5年后将改变世界。’5年之后,我又听到他说了一次;到了第三个5年,比尔·盖茨有一次提起语音,他说:‘这话我过去说了两次。’”创新工场CEO李开复所讲述的这件往事,折射出语音技术当时所面临的尴尬前景。
而前谷歌中国的高级研究员、《浪潮之巅》的作者吴军最近在微博里调侃道:“语音识别(在产品上)忽悠人从上世纪90年代开始,大约每10年一个周期,最后的结果相同,就是大家发现这是个玩具,而不是工具……如此反复。不过我相信最后有一次不再是忽悠人,但是不是现在这一次?”
至少,在扑面而来的移动互联网和云计算大潮中,想象从来没有像这一次这么像真的:决定语音识别技术精确度的关键性因素在于语料库的丰富程度。
在过去,语料库的建立,主要是通过人工采集声音信号来完成,需要花费大量的时间和精力,语料库的增量非常有限,这也意味着语音技术的精确度提升速度非常低。而在移动互联网时代,语音交互的终端和应用在不断涌现;另一方面,云计算能够处理比以往更海量的用户语音交互数据,云端的服务器能够不断收集、处理这些数据,在不断反馈训练中持续进化语音理解能力。
并且,随着移动用户和多种移动终端的爆发式增长,人们对语音应用的需求前所未有的强烈:移动终端设备键盘与屏幕尺寸小,用手指输入并不方便,尤其是在移动的应用场景中,眼忙手忙,语音输入作为信息交互最自然、便捷的手段,更能发挥它先天性的作用。
而苹果公司所推出的Siri功能在全球所引发的疯狂,则成为语音技术在移动互联网上被引爆的直接导火索,也让一直苦于找不到语音卖点的厂商茅塞顿开。苹果的高明之处,在于将Siri的语音技术与苹果封闭系统内的各行各业的信息服务、应用进行了无缝的对接,并且整合了三大数据库:Yelp、维基百科、Wolfram Alpha,这就意味着Siri不仅仅是一个被人“调戏”的玩具,而是在某种程度上可以帮人们解决实际问题:查找餐馆、地图、翻译……
尽管在目前看来,Siri的实用性依然有限,但随着用户越来越多,建立的语料数据库就越丰富,就越能通过数据的不断纠正变得越来越“聪明”,这就有了“人工智能”的意味。
在这个横跨手机、平板电脑、汽车、电视、 导航设备、音乐播放器、个人电脑等领域的绝大市场商机面前,谷歌、微软等国际巨头都加快了将语音技术向消费级市场商用的脚步:谷歌计划今年上半年发布平板电脑Google Nexus,并将搭载Majel网络语音识别技术;而微软于2020年收购语音技术公司TellMe之后,计划今年将TellMe技术用于Windows 8及下一代Windows Phone系统中;此外,国际语音巨头Nuance已经将语音生意做到了全球,且来势凶猛:今年1月份,Nuance收购了竞争对手 Vlingo,期望整合双方各自的技术优势,在全球迅速膨胀的移动语音消费市场,瓜分更大的蛋糕。
平台机会
随着Siri在全球的大热,人们不禁纷纷发出这样的疑问:谁是中国的下一个Siri?作为国内最大的智能语音技术提供商,原本低调
文档评论(0)