大数据下资源整合和知识共享(下).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据下的 资源整合和知识共享(下) ;;;(二)大数据相关技术;;三个层次;;HDFS包含了一个Namenodes,还有很多的Datanodes。 Namenodes进行一个元数据的管理,Datanodes保存在不同的物理设备上。 Datanodes里面绿色的小方框,是存储块。;10K nodes, 100 million files, 10 PB;;MapReduce 流程;HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,实现的编程语言为Java。 它是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似BigTable 规模的服务。 因此,它可以容错地存储海量稀疏的数据。;Hive是基于Hadoop的一个数据仓库工具。 主要考虑大数据查询效率问题的解决,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能。 可以将SQL语句转换为MapReduce任务进行运行。;说明: Hive具有容错的机制。;Pig;;大数据的数据挖掘与机器学习,是大数据技术的核心,也是人工智能的核心。;数据挖掘案例:购物篮分析;机器学习;3.数据交互与可视化;信息可视化;技术: 分布式实时渲染(GPU/CPU) 多层次交互可视分析(Level of Details ) 结合数据挖掘/机器学习的智能可视化;;(一)智慧城市;城市空气质量全方位实时监控;存在问题和挑战;POI;1;空间 分类器;优势 ;2.智能交通;如何做;问题二:全城的汽车油耗与尾气排放实时监控;大数据解决方案;(二)智能社会;1.大数据与智能超市;目标:探索消费者购物行为,实现对超市科学布局以及商品货架摆放;此外,为营销策划提供决策支持,最终提供春节促销方案。;大数据解决方案;;2.大数据与电商;推荐;4.大数据与社交媒体;社交网络分析;情感分析的作用;5.大数据与社会问题监管;6.大数据与日常运作;总结

文档评论(0)

smashing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档