- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
腾云天下:无数据不AI,无人工不智能.doc
腾云天下:无数据不AI,无人工不智能
今年又出现了很多热词,不止大数据,人工智能(AI)、深度学习、机器学习、AR、VR……形形色色的创业团队鲸吞了市场上相当一大部分的投资。所有这一切好像跟我们相关,但又好像离商业价值那么远,他们到底跟数据有什么关系,有没有可能给其他行业创造价值?
新时代的到来
后数据爆炸时代
其实整个人类的发展历史,就是人类不断尝试记录、测量自身和世界的过程。无论从古时候人类发明算盘、阿拉伯数字,又到近代发明二进制计算机,都像是这一现象的反映,而人类对自己,包括对世界的认知还是那么浅。比如描述一个人时还只能说这人是男是女,是老是少,身高、体重等;提到环境时会说气温怎么样、湿度怎么样……但人类对于数据测量的需求一直没有减弱。
根据TalkingData的数据统计,目前在中国,智能手机(含平板电脑)有13.05亿用户,智能手表等可穿戴设备已经达到千万级,这意味着什么?智能手机、智能设备基本上人手一部甚至更多,而每部智能手机平均携带多达16种的传感器,每天产生1G数据。这不仅加强了人类感知和数字化世界的能力,也让数据以前所未有的速度在产生和发展。所有这一切现象,都揭示了以人为中心的世界正在加速数字化。这是一个数据爆发的时代。
人工智能:已经过了单纯积累数据量的时代
移动设备已经成为人类身体的延伸。根据TalkingData的数据统计,我们每天使用手机将近四个小时。不管是上网,还是在现实生活中,在家、上班、吃饭、旅游、消费……我们所有的足迹都被默默地记录了下来。数据行业迎来了历史上最好的时刻――数据爆发的时刻。
但这已不是一个单纯的积累数据量的时代,新的时代对计算提出了更高的挑战。
第一, 这些数据并不是所有的都被存储和收集。大量隐形数据的采集、运算、存储、传输等领域依然存在着巨大的障碍。
第二, 如何从大量的数据里面解读人的动作、识别人的场景是更重要的问题。现在很多数据都是非结构化的情境数据,例如图像、声音、姿态、动作,需要人工智能的帮忙从中提炼有价值的信息。世界上顶尖的技术公司都在尝试用算法、机器学习去还原人在现实生活中的动作,不管视觉、听觉、姿态、感知还是做一些基础的工作,现在语音、图像识别技术都在大规模发展,但是为什么当数十亿大脑神经元彼此传递信号时,就会出现喜爱、恐惧或愤怒的主观感受呢?对此,我们依然一无所知。人工智能对世界的认知还停留在早期阶段。
数据促进了人工智能的发展。AI过去与现在的最大区别是,必须具备的计算能力、原始数据和处理速度现在都有了,因此AI技术现在能大放异彩。目前人工智能在识别(包括认知)产生很大进展的原因首先是数据量带来的。谷歌在语音识别领域取得了很大的突破,但这背后的原因是谷歌建立了几十亿音频的库,而且用人类的智慧标注它,所以可以用算法、人工智能找到模式,甚至可以区别不同口音。图像也是如此:过去几十年里,人类花了大量时间去标注这些图像,我们才能在图像里面切割识别出各种各样的物体。没有这些人的智慧现在人工智能达不到这样的程度。
人的智慧:AlphaGo背后的故事
以AlphaGo人工智能为代表的AI复兴体现对于世界的认知能力正在加强。在过去的几年间,我们看到,机器学习、强大的算法、强大的处理能力和所谓的“大数据”已可以让机器做一些让人印象深刻的事,比如:实时语言翻译、在复杂的城市环境中安全地开车。
AlphaGo战胜人类被视为AI历史上的里程碑事件。大家看到AlphaGo战胜了李世石,但是不知道背后的故事。TalkingData的CEO崔晓波作为亲历者之一(这场棋赛的解说者),看事情的角度和大家不同,他看到了数据的力量。
他认为,在这场比赛中,关键的获胜因素有两个:
第一,要有足够的数据支撑。AI要模拟人,它首先要知道人在面对不同事情的时候是怎么去把握的,而这种判断和把握的能力就是出自于成千上万的海量数据得出的结果。
AlphaGo拥有一个数据库,里面有十几万份人类6~9段职业棋手的对弈棋谱。Alphago从中模仿人类常见的落子方式,根据谷歌透露的数据,模仿的准确率达到了57%。也就是说,单单这一项功能,就可使AlphaGo在一步的选择上有57%的概率与人类高等级职业棋手相同。2014年,Google来到中国棋院买棋谱,近两年累计记录的棋谱数量是过去几百年的总和:根据KGS统计,KGS平台每年专业段位的对局棋谱的累积量,近三年研究的棋谱数量都接近20万。GoGoD平台的累积大约8.5万专业段位棋谱。18万的棋谱共有近2500万的局面,每一局面都可上下左右、镜面翻转,这个2500万局面就能再乘以8,这个数据量已经能够支撑深度学习。
第二,要有人类的智慧。AlphaGo在下
文档评论(0)