logo

您所在位置网站首页 > 海量文档  > 计算机 > 数据挖掘与模式识别

大数据时代的机遇与挑战 - 江苏省大数据分析技术重点实验室.pdf 5页

本文档一共被下载: ,您可全文免费在线阅读后下载本文档。

  • 支付并下载
  • 收藏该文档
  • 百度一下本文档
  • 修改文档简介
全屏预览

下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
特别说明: 下载前务必先预览,自己验证一下是不是你要下载的文档。
  • 内容提供方 yanpizhuang(上传创作收益人)
  • 发布时间:2017-09-06
  • 需要金币90(10金币=人民币1元)
  • 浏览人气
  • 下载次数
  • 收藏次数
  • 文件大小:496.21 KB
下载过该文档的会员
大数据时代的机遇与挑战 - 江苏省大数据分析技术重点实验室
你可能关注的文档:
大数据时代的机遇与挑战 大数据泛指巨量的数据集,因可从中挖掘出有价值的信息而受到重视。《华 尔街日报》将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大 技术变革。麦肯锡公司的报告指出数据是一种生产资料,大数据是下一个创新、 竞争、生产力提高的前沿。世界经济论坛的报告认定大数据为新财富,价值堪比 石油。因此,发达国家纷纷将开发利用大数据作为夺取新一轮竞争制高点的重要 抓手。 大数据时代的来临 互联网特别是移动互联网的发展,加快了信息化向社会经济各方面、大众日 常生活的渗透。有资料显示,1998 年全球网民平均每月使用流量是 1MB (兆字 节),2000 年是 10MB ,2003 年是 100MB ,2008 年是 1GB(1GB 等于 1024MB ), 2014 年将是 10GB。全网流量累计达到 1EB (即10 亿 GB 或 1000PB )的时间在 2001 年是一年,在 2004 年是一个月,在 2007 年是一周,而 2013 年仅需一天, 即一天产生的信息量可刻满 1.88 亿张 DVD 光盘。我国网民数居世界之首,每天 产生的数据量也位于世界前列。淘宝网站每天有超过数千万笔交易,单日数据产 生量超过 50TB (1TB 等于 1000GB ),存储量40PB(1PB 等于 1000TB)。百度公 司目前数据总量接近 1000PB ,存储网页数量接近1 万亿页,每天大约要处理 60 亿次搜索请求,几十 PB 数据。一个 8Mbps (兆比特每秒)的摄像头一小时能产 生 3.6GB 数据,一个城市若安装几十万个交通和安防摄像头,每月产生的数据 量将达几十 PB。医院也是数据产生集中的地方。现在,一个病人的 CT 影像数 据量达几十 GB ,而全国每年门诊人数以数十亿计,并且他们的信息需要长时间 保存。总之,大数据存在于各行各业,一个大数据时代正在到来。 信息爆炸不自今日起,但近年来人们更加感受到大数据的来势迅猛。一方面, 网民数量不断增加,另一方面,以物联网和家电为代表的联网设备数量增长更快。 2007 年全球有 5 亿个设备联网,人均 0.1 个;2013 年全球将有 500 亿个设备联 网,人均 70 个。随着宽带化的发展,人均网络接入带宽和流量也迅速提升。全 球新产生数据年增 40% ,即信息总量每两年就可以翻番,这一趋势还将持续。目 前,单一数据集容量超过几十 TB 甚至数 PB 已不罕见,其规模大到无法在容许 的时间内用常规软件工具对其内容进行抓取、管理和处理。 数据规模越大,处理的难度也越大,但对其进行挖掘可能得到的价值更大, 这就是大数据热的原因。首先,大数据反映舆情和民意。网民在网上产生的海量 数据,记录着他们的思想、行为乃至情感,这是信息时代现实社会与网络空间深 度融合的产物,蕴含着丰富的内涵和很多规律性信息。根据中国互联网络信息中 心统计,2012 年底我国网民数为 5.64 亿,手机网民为 4.2 亿,通过分析相关数 据,可以了解大众需求、诉求和意见。其次,企业和政府的信息系统每天源源不 断产生大量数据。根据赛门铁克公司的调研报告,全球企业的信息存储总量已达 2.2ZB (1ZB 等于 1000EB ),年增67%。医院、学校和银行等也都会收集和存 储大量信息。政府可以部署传感器等感知单元,收集环境和社会管理所需的信息。 2011 年,英国《自然》杂志曾出版专刊指出,倘若能够更有效地组织和使用大 数据,人类将得到更多的机会发挥科学技术对社会发展的巨大推动作用。 大数据应用的领域 大数据技术可运用到各行各业。宏观经济方面,IBM 日本公司建立经济指 标预测系统,从互联网新闻中搜索影响制造业的 480 项经济数据,计算采购经理 人指数的预测值。印第安纳大学利用谷歌公司提供的心情分析工具,从近千万条 网民留言中归纳出六种心情,进而对道琼斯工业指数的变化进行预测,准确率达 到 87%。制造业方面,华尔街对冲基金依据购物网站的顾客评论,分析企业产品 销售状况;一些企业利用大数据分析实现对采购和合理库存量的管理 ,通过分析 网上数据了解客户需求、掌握市场动向。有资料显示,全球零售商因盲目进货导 致的销售损失每年达 1000 亿美元,这方面的数据分析大有作为。 在农业领域,硅谷有个气候公司,从美国气象局等数据库中获得几十年的天 气数据,将各地降雨、气温、土壤状况与历年农作物产量的相关度做成精密图表, 预测农场来年产量,

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码: 点击我更换图片

“原创力文档”前称为“文档投稿赚钱网”,本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。原创力文档是网络服务平台方,若您的权利被侵害,侵权客服QQ:3005833200 电话:19940600175 欢迎举报,上传者QQ群:784321556