- 5
- 0
- 约 10页
- 2018-04-07 发布于重庆
- 举报
百度成为「大脑」,它是怎样思考)
当百度成为「大脑」,它是怎样思考的?
HYPERLINK /read/view/203658 \l comment
[核心提示] 本文重点解读百度三层设计中(百度大脑,数据工厂,开放云)最顶层的设计,百度大脑计划,让我们来一次详细的百度大脑解刨。
近日百度终于发布了让人期待已久的百度大数据计划,而本文重点解读百度三层设计中(百度大脑,数据工厂,开放云)最顶层的设计,百度大脑计划,让我们来一次详细的百度大脑解刨。
而该计划究竟是什么让我们来一次深入了解,必须从三层架构一层层解刨。
第一层:开放云
作为一个人类婴儿,最重中之重的事情就是记忆,而记忆也是一切的发展前提。同样,我们将百度人脑看成人脑的话,那么第一件事情,必然是存储。人类没有记忆就没有关联,也更不用提决策与创造,而人类之所以能够在灵长类动物中立足,正是有着极大的可以存储记忆的脑容量,那么机器要模仿人脑也必然要建立在拥有庞大的存储能力之上,百度在真正积累数据到一定程度后才开始该项目。
我们来看下百度存储能力的发展过程:2010 年,百度的机器学习能力并不是很高,只拥有几百台的服务器,特征向量只有十万。两年后也就是 2012 年,百度的单集群规模达到了几十万,已经完全能够做到让这些机器在同一时间做同一件事情,特征向量从十万上升到两百亿!
而当在百度达到两百亿后机器学习就到达了一定瓶颈,就算特征向量增加到三百亿,四百亿,对机器学习的帮助并不是很大,而此时拥极强存储能力的百度开始了在机器学习上的“深度学习”的分支发展,进而升级已有的人工智能大脑。
备注:
机器处理能力的评判标准有两个:第一个是看服务器规模,第二个是看特征向量大小。
特征向量:将文本语音图像视频等内容转化为机器能够读懂的一连串关键数据,数据越多,机器学习的就会越好,用户的搜索结果就会越精确,对用户的搜索体验效果也会随之上升,但对服务器的压力也会相应加大。百度能够仅用两年时间从 10 万直接飙升到 200 亿,足以见得百度服务器技术实力的雄厚。
此外这一段并非只讲存储,同时也是在讲百度大脑的发展,因为有了记忆就会发生关联,进而产生决策,这是一个整体前进的过程。
第二层:数据工厂
作为一个人,要调取某部分的记忆,就会很自然的联想到某个词,某个画面,某个音乐等等就能记起很多事情,比如当你听老歌时,看到童年的玩具时,汹涌的记忆总会被调出来。
当然这是因为人类大脑的神经连接结构允许我们这样去检索,而机器是不允许的,数据存储在硬盘上,机器想要找到某个数据,必须一个个访问过去,机器没有分类的概念,就像在图书馆中,机器是一个不会看分类的管理员,他要找某一本书时只能一本一本的找过去,十分笨拙。
也就是说,机器要想搜索什么内容时,必须有人来帮助它建立起分类,但最矛盾的就是,在错综复杂的语言结构中,我们很难为一个词去下定义,比如当你在说“苹果”这个词的时候,你如何告诉机器他的分类?苹果究竟是一个名词,还是一个公司?而决定一个词的意义的则是语境,也就是机器要依靠其他词语的出现来为这个词做模糊的定义,不能完全给它下死定义而是要根据环境来下,并且它还应当是动态的,不断变化的。
这种搜索技术也依然要百度的大脑配合才能达到,对每一个词的定义应该是一个库,而这个库中的每一个词又都各自构成库,百度的数据工厂所创造的算法,就是在这么一个数据之海中去为他们建立管理,然后去索引。
数据工厂相当于人脑中的记忆关联过程:将某个词同时与其他词或是某个场景等等建立起动态关联的过程。
第三层:百度大脑
人脑有了记忆,有了关联之后就会进行决策,比如小孩子碰到开水,烫到了手下次就不会碰,就是因为记忆了开水和烫手的痛苦,并将这两个记忆关联在了一起,才有了下次不去碰开水的决策。而百度大脑就是在模仿这些行为,做记忆关联之后的决策、行动、创造。
我之前关于开放云和数据工厂的分析完全是建立在搜索引擎之上,只是站在了百度对汉语能力的理解而已,而那时百度的人工智能也确实只是刚出生的婴儿而已,只能在 PC 端爬行,但是当智能手机诞生,可穿戴智能设备的出现后,百度开始成为可以走路的婴儿,此时百度大脑的智力已是高达两岁的婴儿水平。
从搜索引擎智能到硬件智能,这是一个平面到立体,二维到三维的过程。原因是以前百度搜集到的数据只能够是 PC 端用户的搜索行为,这之中充其量只有文字内容罢了,百度所能够建立的仅仅只是语言理解,对用户的输入文字数据做不断的处理与反馈,但是到了手机端,智能硬件端则完全变天,百度可以收集到的不仅仅只会是语言数据,更会收集到一整套的使用场景数据!
此时,百度从为用户提供搜索结果的搜索引擎开始转变为向用户提供全方位解决方案的人工智能,想象力无穷。
那么,百度大脑将会如何模仿人类的感知,再到思考,以至于最后产生决策、生产、创造呢?
感知部分:
这里,我们还是先回看百
您可能关注的文档
最近下载
- 核医学教学课件:血液和淋巴显像.ppt VIP
- 重庆市各地方周氏支族源流(1-170支族).doc VIP
- 建筑工程质量管理体系流程图.docx
- 淋巴系统核医学检查课件.ppt VIP
- (高清版)B-T 6003.1-2022 试验筛 技术要求和检验 第1部分:金属丝编织网试验筛.pdf VIP
- (已压缩)TUCST007-2020房屋建筑与市政基础设施工程施工安全风险评估技术标准.docx VIP
- 2026年国家公务员考试申论真题及参考答案(考生回忆版).docx VIP
- 部编版语文二年级上册期中常考七大重点题型专项训练.docx VIP
- 机器人操作系统(ROS)及仿真应用 课件全套 第1--9章 Linux Ubuntu入门基础--- 基于ROS的服务机器人应用实例.ppt
- 压疮的预防及护理技术操作考核评分标准编辑.docx VIP
原创力文档

文档评论(0)