BigDataAndTheRevolutionItMakes调研报告.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据;大数据时代;3;一天之间,互联网上要发生多少事;? 互联网企业:社交网站、微博、视频网站、电子商务网站 ? 物联网、移动设备、终端中的商品、个人位置、传感器采集的数据 ? 通信和互联网运营商 ? 天文望远镜拍摄的图像、视频数据、气象学里面的卫星云图数据等;想驾驭这庞大的数据,我们必须了解大数据的特征。;Volume 海量;大数据的核心; 大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……;大数据时代;小数据时代的随机采样,最少的数据获得最多的信息。当数据处理技术已经发生翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。 我们需要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。;谷歌通过数以亿计的关键字分析,例如“治疗感冒的药物、发烧头痛”,如该地区普遍性短期内爆发关键字搜索4.5亿条,则有可能发生流感;流感地域分布图;执迷于精确性是信息缺乏时代和模拟时代的产物。 只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法使用。我们乐于接受数据的纷繁复杂,而不再追求精确性。;麻省理工的两位经济学家,提出一个大数据方案,那就是接受更混乱的数据。通过一个软件在互联网上收集数据,他们每天可以收集到50万种商品的价格。;在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。 我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。;沃尔玛对历史交易记录的数据库进行了观察,这个数据库记录的不仅每一个顾客的购物清单以及消费额,还包括购物篮中的物品、具体购买时间,甚至购买当日的天气。;大数据时代;;● 莫里的导航图:从库房里找到的航海日志,其内容是无章可循的,页面边上尽是奇怪的打油诗和乱七八糟的信手涂鸦,与其说它们是对航海行程的记录,还不如说它们是船员在航海途中无聊的???乐而已,但里面有莫里需要的信息,特定日期、特定地点的风、水和天气情况的记录。莫里将这些数据整合,把整个大西洋分区,并按时间标出温度、风速和风向,这就形成了一张有效的航海线路图。 ● 坐姿研究与汽车防盗系统:当一个人坐着的时候,他的身形、姿势和重量分布都可以数据化。日本先进工业技术研究所的教授越水重臣通过在汽车座椅下部安装的压力传感器,以测量人对椅子施加的压力,把人体坐姿特征转化成了数据,这样就会产生独属于每个乘坐者的精确数据资料。在这个实验中,这个系统能根据人体对座位的压力差异识别出乘坐者的身份,准确率高达98%。有了这个系统之后,汽车就能识别出驾驶者是不是车主。;● “数据化”,这是指一种把现象转变为可制表分析的量化形式的过程。 ● “数字化”,指的是把模拟数据转换成用0和1表示的二进制码,这样电脑就可以处理这些数据了。 ● 数据化和数字化不是对立的。数据化这一概念的提出不是对数字化的否定,而是对数字化的拓展与推进。数据化关注的焦点更多地集中在比数字比特(bit)更复杂、更高级的存在形态上。数据是所有数字比特对象的子集,数据化是数字化进程中的一个方向。 ● 数据化是内生于数字化的,就像半导体化内生于电子化,就像“数字的”内生于“模拟的”,就像活字印刷术内生于印刷术。 ● 数字化带来了数据化,但是数字化无法取代数据化;● 记录信息的能力是原始社会和先进社会的分界线之一。 ● 计量和记录一起促成了数据的诞生,它们是数据化最早的根基。 ● 伴随着数据记录的发展,人类探索世界的想法一直在膨胀,我们渴望能更精准地记录时间、距离、地点、体积和重量等;到了19世纪,随着科学家们发现了新工具来测量和记录电流、气压、温度、声频之类的自然现象,科学已离不开定量化了。 ● 计算机的出现带来了数字测量和存储设备,这大大提高了数据化的效率;计算机也使得通过数学分析挖掘出数据更大的价值变成了可能。;● 当文字变成数据,它就大显神通了—人可以用之阅读,机器也可用之分析。谷歌精明地利用这些数据化了的文本来改进它的机器翻译服务;亚马逊拥有数据化的书籍,而不是数字图像的书籍,Kindle可以让人们更改字体大小、颜色和背景来看书。 ● 定位时时刻刻都可能生成信息,谷歌的街景车(Street View Cars)边拍照边收集无线路由器信息;iPhone本身就是一个“移动间谍”,一直在用户不知情的情况下收集位置和无线数据然后传回苹果公司;当然,谷歌的安卓手机和微软的手机操作系统也在收集这一类数据。 ● 数据化直接触摸到了我们的关系、经历和情感。Facebook将社交关系数据化—Facebook “社交图谱”;Twitter让人们能记录以及分享他们零散的想法,从而

文档评论(0)

贪玩蓝月 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档