- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
——大数据引领我们走向数据智能化时代;;;大数据时代的背景;全球每秒钟发送2.9百万封电子邮件,一分钟读一篇的话,足够一个人昼夜不息的读5.5年…
每天会有2.88万个小时的视频上传到Youtube,足够一个人昼夜不息的观看3.3年…
推特上每天发布5千万条消息,假设10秒钟浏览一条信息,这些消息足够一个人昼夜不息的浏览16年…
每天亚马逊上将产生6.3百万笔订单…
每个月网民在Facebook上要花费7千亿分钟,被移动互联网使用者发送和接收的数据高达1.3EB…
Google上每天需要处理24PB的数据…;;20世纪90年代,数据仓库之父的BillInmon就经常提及BigData。;体量Volume;Value价值;2010年海地地震,海地人散落在全国各地,援助人员为弄清该去哪里援助手忙脚乱。传统上,他们只能通过飞往灾区上空来查找需要援助的人群。
一些研究人员采取了一种不同的做法:他们开始跟踪海地人所持手机内部的SIM卡,由此判断出手机持有人所处的位置和行动方向。正如一份联合国(UN)报告所述,此举帮助他们“准确地分析出了逾60万名海地人逃离太子港之后的目的地。”后来,当海地爆发霍乱疫情时,同一批研究人员再次通过追踪SIM卡把药品投放到正确的地点,阻止了疫情的蔓延。;Variety多样性;非结构化数据;Velocity速度;Volume数据量;大数据不仅仅是“大”;指数型增长的海量数据;大数据=海量数据+复杂类型的数据;;;;软件是大数据的引擎;大数据生态:软件是引擎;
大数据技术被设计用于在成本可承受的条件下,通过非常快速(velocity)地采集、发现和分析,从大量(volumes)、多类别(variety)的数据中提取价值(value),将是IT领域新一代的技术与架构。
;技术领域的挑战;分析技术:
数据处理:自然语言处理技术
统计和分析:A/Btest;topN排行榜;地域占比;文本情感分析
数据挖掘:关联规则分析;分类;聚类
模型预测:预测模型;机器学习;建模仿真
大数据技术:
数据采集:ETL工具
数据存取:关系数据库;NoSQL;SQL等
基础架构支持:云存储;分布式文件系统等
计算结果展现:云计算;标签云;关系图等;大数据的相关技术;数据众包;大数据的相关技术;分布式文件系统;??布式文件系统;分布式文件系统;分布式文件系统;分布式文件系统;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;非关系型数据库NoSQL;云计算和云存储;;云计算和云存储;实时流处理;实时流处理;大数据的相关技术;A/BTesting
;MapReduce;MapReduce;R语言;大数据的相关技术;标签云;标签云;标签云;聚类图;空间信息流;热图;热图;;大数据赋予我们洞察未来的能力;挑战;一、未卜先知怀孕案例;一、未卜先知怀孕案例;一、未卜先知怀孕案例;一、未卜先知怀孕案例;一、未卜先知怀孕案例
文档评论(0)