百度开放“大数据引擎”.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档,助力人生,欢迎关注小编! 百度开放“大数据引擎” 4月下旬,百度正式开放了名为“大数据引擎”的技术体系。简单来说,“大数据引擎”指的是对大规模的数据进行收集、存储、计算、挖掘和管理的一套系统。通过百度的深度学习技术和数据建模技术,能够让数据分析变得更实时和精准。这次对外开放的,主要包括数据中心的硬件、数据分析技术和深度学习技术。 百度把这个“大数据引擎”分为三个层次:开放云、数据工厂和百度大脑。 开放云指的是这套引擎的基础架构——分布式的低能耗数据中心,即硬件部分。其中包括数据中心的服务器设计、数据中心规划和设计、分布式系统、超大规模集群自动化运维、大规模GPU并行化平台等。 数据工厂,可以支持超大规模的异构数据查询和大数据分析,也就是调用硬件来完成数据的挖掘和分析。 百度大脑,其实是对单集群规模数据能力的扩展——基于深度学习技术,让机器模拟人类大脑多层神经元的思维模式做出预测模型。 “大数据引擎”是这样运转的:百度对自己以及各行各业的数据进行挖掘,利用“数据工厂”和“百度大脑”分析它们,输出数据分析结果,为自己和合作伙伴提供解决方案。先来看看百度是如何在自己的产品上使用大数据引擎的。 最常见的是百度一些产品功能上的应用。比如,百度图片搜索的“以图搜图”功能。当用户上传一张图片到图片搜索之后,系统会自动将这张图片与百度服务器上数亿计的图片进行比对,并查找出相似的图片,然后实时展示出来。百度输入法的中文语音转换成文字的功能也是利用了相似的原理——将语音数据进行收集、分析、比对,然后找出准确的文字进行对应。 还有数据模型的建立。比如,百度会对人们在网上对某个旅游景点进行搜索的行为和实际旅游人数的数据进行比对分析,依此绘制出某个景点在两个星期内的“热力图”,以显示这个景点的拥挤程度。现在,百度的旅游预测模型已经可以精准到两个星期。你或许记得今年春节时百度发布的“百度迁徙”——一张全国范围内的春运热力图,就是基于相似的模型实现的。这些数据分析技术同样被应用在百度的广告系统中。 百度这套“大数据引擎”,会首先被应用在哪些场景上?据百度称,医疗将会是首个被大数据技术改变的行业。如今,随着可穿戴计算设备的兴起,人们可以记录下大量的生活方式,比如每天的运动量和运动时间、睡眠量、坐姿时间、身高、血压等,这些被量化的数据涵盖了我们身体状况的方方面面,将会成为病情分析的重要依据。而对于医院来说,这些数据无时无刻不在产生,并零散分布在各个平台上,已经超出了医院IT系统的数据存储和分析能力。所以,“大数据引擎”将可以帮医院解决这样的问题。 另一个例子是交通拥堵的治理。基于百度地图,百度已经可以实时地收集整个城市的交通状况,通过分析之后得出结果,可以帮助政府进行决策。例如对城市中某些区域的红绿灯的转换/停留时间进行微调,用不同的策略实现整个城市交通状况的提升。

文档评论(0)

s64851 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6120215050000015

1亿VIP精品文档

相关文档