互联网与大数据.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
互联网与大数据 大数据概述 01 大数据分类(3种划分方式) 02 03 大数据的价值 大数据概述——数据量 2013 年中国产生的数据总量超过0.8ZB(相当于8亿TB),2 倍于2012 年,相当于2009 年全球的数据总量。预计到2020 年,中国产生的数据总量将是2013年的10倍,超过8.5ZB。 ——DNET《数据中心2013:硬件重构与软件定义》年度技术报告 大数据概述 01 大数据分类(3种划分方式) 02 03 大数据的价值 大数据分类——按产生主体划分 次外层:大量人产生的数据 最外层:巨量机器产生的数据 大数据分类——按数据来源划分 通过服务器和数据中心数量,以及各行业数据梳理,大致判断国内2013年一年产生的数据总量以及大致分布,数据主要分布在以下行业: 1、BAT为代表的互联网公司。 2、电信、金融、保险、电力、石化系统。 3、公共安全、医疗、交通领域。 4、气象、教育、地理、政务等。 5、其他,商业销售、制造业、农业、物流和流通等领域。 百度 BAT为代表的互联网公司 大数据分类——按数据来源划分 金融与保险 电信、金融、保险、电力、石化系统 大数据分类——按数据来源划分 医疗卫生 公共安全、医疗、交通领域 大数据分类——按数据来源划分 政务与教育 气象、教育、地理、政务等领域 大数据分类——按数据来源划分 商业销售、制造业、农业、物流和流通等领域 大数据分类——按数据来源划分 制造业 制造业的存储数据类型: 产品设计数据:以文件为主,非结构化,共享要求较高,保存时间较长。 企业生产环节的业务数据:数据库结构化数据 生产监控数据:数据量非常大 大数据分类——按存储形式划分 大数据不仅仅体现在数据量大,也体现在数据类型多。如此海量的数据中,仅有20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络、物联网、电子商务等领域的非结构化或半结构化的数据。 大数据分类——按存储形式划分 结构化数据 即行数据,可用二维表结构来逻辑表达实现 主要存储在关系型数据库中 先有结构再有数据,结构一般不变 处理起来较方便 大数据分类——按存储形式划分 非结构化数据 相对于结构化数据而言,不方便用数据库二维逻辑表来表现 非纯文本类数据,没有标准格式 包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息 存储在非结构数据库中 非结构化WEB数据库:突破了关系数据库结构定义不易改变和数据定长的限制 大数据分类——按存储形式划分 半结构化数据 介于完全结构化数据和完全无结构的数据之间 格式较为规范,一般都是纯文本数据 包括日志数据、XML、JSON等格式的数据 一般是自描述的,数据的结构和内容混在一起,没有明显的区分 数据模型主要为树和图的形式。 作为国内新锐媒体代表的“新周刊”是新浪微博的第一批受益媒体,他们开通了新浪微博后,截止到2010年11月19日,粉丝数已经达到了878966人,发表微博6488条。 封新城 新周刊 主编、媒体微博交相呼应 截止到2010年11月,封新城的微博粉丝数已接近36万 新周刊微博案例分享 微博话题征集:都市快报通过在新浪微博上进行写给100岁新中国的信,并通过整版选取内容刊登,极富新意 版面整体合作:推出《微生活》栏目,此栏目是都市快报和新浪网合作推出的版面。《微生活》的内容来自新浪微博。《微生活》和读者分享的则是一周微博热议、微博语录、热文微议等精彩内容。 都市快报微博案例分享 微博节省沟通成本, 新闻发布更为便捷, 让团队的协同工作更为快速 南京零距离微博案例分享 厕所没有纸了 怎么办 ? 谁最先报道了 绵阳地震 ? 11除70的商的小数点后面的第200位上的 数字是几 ? 大数据概述 01 大数据分类(3种划分方式) 02 03 大数据的价值 大数据在宏观经济管理领域的应用 IBM日本公司建立了一个经济指标预测系统,它从互联网新闻中搜索出影响制造业的480项经济数据,再计算出PMI预测值,准确度相当高。 印第安纳大学学者利用Google提供的心情分析工具,根据用户近千万条短信、微博留言中预测道琼斯工业指数。准确率高达87%。 淘宝网建立了“淘宝CPI”,它通过采集、编制淘宝网上390个类目的热门商品价格来统计CPI,它比国家统计局公布的CPI还提前半个月预测经济的走势。 大数据在农业领域的应用 Google前雇员创办Climate公司,从美国气象局等数据库中获得几十年的天气数据,将各地的降雨、气温和土壤状况及历年农作物产量做成精密图表,从而能够预测美国任一农场下一年的产量。任何一个农场主去他那里问明年种什么能卖出去、能赚钱,他能告诉你,说错了他保证赔偿,赔偿比保险公司还要高,到现在为止他还没有赔过。 通过手机上农产品“移动支付”数

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档