大数据技术交流.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据技术交流 2013.02 YOUR SITE HERE 目录 1.大数据技术介绍 2.Hadoop(HDFS,MapReduce)介绍 3.Hadoop的最新发展 4.流计算技术 5.内存数据库 6.列式数据库 7.各技术适用的场合 8.讨论 YOUR SITE HERE 什么是大数据? 大数据 指的是海量无法通过传统方式管理的数 据。 Big Data作为一个专有名词成为热点,主要应归功于 近年来互联网、云计算、移动和物联网的迅猛发展。无所不 在的移动设备、RFID、无线传感器每分每秒都在产生数 据,数以亿计用户的互联网服务时时刻刻在产生巨量的交 互……要处理的数据量实在是太大、增长太快了,而业务需 求和竞争压力对数据处理的实时性、有效性又提出了更高要 求,传统的常规技术手段根本无法应付。 YOUR SITE HERE 大数据的4V特性 非结构化数据的超大规模和增长 总数据量的80~90% 体量Volume 比结构化数据增长快10倍到50倍 是传统数据仓库的10倍到50倍 大数据的异构和多样性 很多不同形式(文本、图像、视频、机器数据) 多样性Variety 无模式或者模式不明显 不连贯的语法或句义 大量的不相关信息 价值密度Value 对未来趋势与模式的可预测分析 深度复杂分析(机器学习、人工智能Vs传统商务智 能(咨询、报告等) 实时分析而非批量式分析 速度Velocity 数据输入、处理与丢弃 立竿见影而非事后见效 YOUR SITE HERE 大数据技术 存储 处理 应用 分布式缓存、基于 Map Reduce, HIVE,pig,R, MPP的分布式数据 mahout 流计算 库、分布式文件系 等查询统计,数据 统、各种NoSQL分布 挖掘技术 式存储方案, 内存数据 库等。 YOUR SITE HERE 大数据的存储 采用了一批新技术,主要包括分布式缓存、基于MPP的 分布式数据库、分布式文件系统、各种NoSQL分布式存 储方案等。 YOUR SITE HERE 分布式数据库与传统数据库对比

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档