- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
YOUR SITE HERE 流计算产品: 1.Yahoo的S4: S4是一个通用的、分布式的、可扩展的、分区容错的、可插拔的流式系统,Yahoo!开发S4系统,主要是为了解决:搜索广告的展现、处理用户的点击反馈。 2. Twitter的storm Twitter的storm:Storm是一个分布式的、容错的实时计算系统 Storm用途:可用于处理消息和更新数据库(流处理),在数据流上进行持续查询,并以流的形式返回结果到客户端(持续计算),并行化一个类似实时查询的热点查询(分布式的RPC)。 3.streamBase YOUR SITE HERE Items\Projects Yahoo! s4 Twitter Storm 协议 Apache license 2.0 Eclipse Public License 1.0 开发语言 Java Clojure,Java,Clojure编写了核心代码 结构 去中心化的对等结构 有中心节点nimbus,但非关键 通信 可插拔的通讯层,目前是基于UDP的实现 基于facebook开源的thrift框架 事件/Stream K,A序列,用户可自定义事件类 提供Tuple类,用户不可自定义事件类, 但是可以命名field和注册序列化器 处理单元 Processing Elements,内置PE处理 Bolt,没有内置任务,提供IBasicBolt处理 count,join和aggregate等常见任务 自动ack 第三方交互 提供API,Client Adapter/Driver,第三方客户端输入或者输出事件 定义Spout用于产生Stream,没有标准输出API 持久化 提供Persist API规范,可根据频率或者次数做持久化 无特定API,用户可自行选择处理 可靠处理 无,可能会丢失事件 提供对事件处理的可靠保证(可选) 多语言支持 暂时只支持Java 多语言支持良好,本身支持Java,Clojure, 其他非JVM语言通过thrift和进程间通讯 Failover 部分支持,数据无法failover 部分支持,数据同样无法failover Load Balance 不支持 不支持 并行处理 取决于节点数目,不可调节 可配置worker和task数目,storm会尽量将worker和task均匀分布 动态增删节点 不支持 支持 动态部署 不支持 支持 web管理 不支持 支持 代码成熟度 半成品 成熟 活跃度 低 活跃 编程 编程 + XML配置 纯编程 YOUR SITE HERE 目录 1.大数据技术介绍 2.Hadoop(HDFS,MapReduce)介绍 3.Hadoop的最新发展 4.流计算技术 5.内存数据库 6.列式数据库 7.各技术适用的场合 8.讨论 YOUR SITE HERE 内存数据库:大数据时代数据管理新宠 内存数据库,顾名思义就是将数据放在内存中直接操作的数据库。相对于磁盘,内存的数据读写速度要高出几个数量级,将数据保存在内存中相比从磁盘上访问能够极大地提高应用的性能。同时,内存数据库抛弃了磁盘数据管理的传统方式,基于全部数据都在内存中重新设计了体系结构,并且在数据缓存、快速算法、并行操作方面也进行了相应的改进,所以数据处理速度比传统数据库的数据处理速度要快很多,一般都在10倍以上。内存数据库的最大特点是其“主拷贝”或“工作版本”常驻内存,即活动事务只与实时内存数据库的内存拷贝打交道。 YOUR SITE HERE 主流内存数据库产品1 ·Oracle TimesTen Oracle TimesTen是Oracle从TimesTen公司收购的一个内存优化的关系数据库,它为应用程序提供了实时企业和行业(例如电信、资本市场和国防)所需的即时响应性和非常高的吞吐量。Oracle TimesTen可作为高速缓存或嵌入式数据库被部署在应用程序层中,它利用标准的 SQL 接口对完全位于物理内存中的数据存储区进行操作。 ·IBM SolidDB IBM SolidDB是一款数据管理平台,该平台将基于内存和磁盘的全事务处理数据库引擎、载体级高,可用性及强大的数据复制功能紧密地融为一体。SolidDB集基于内存和磁盘的多线程数据库引擎于一身,以提高事务处理速度并在同一数据库内最有效地利用系统资源。SolidDB管理平台的设计可以无缝融合到需要高速、灵活以及需要不间断访问的数据管理技术解决方案中。用户既可以把表建在内存内,也可以象普通数据库一样建在磁盘上,使用非常灵活,而且具备完善的数据保护机制。 YOUR SITE HERE 主流内存数据库产品2 ·eXtremeDB eXtremeDB实时数据库是McObject公司的一款特
您可能关注的文档
最近下载
- 2025凉山州继续教育公需科目满分答案-《网络数据安全管理条列》解读.docx VIP
- 2024-2025学年人教版九年级全一册英语重点短语循环默写清单(1-3组).pdf VIP
- 2024年中考语文二轮复习:现代文阅读(小说+散文)60篇刷题练习题汇编(含答案解析).doc VIP
- 九年级英语全一册200组重要短语默写.docx VIP
- 英语高考核心高频688词汇 .pdf VIP
- 2025凉山州继续教育公需科目满分答案-发展生成式人工智能,助力创新驱动发展.docx VIP
- 三年级小学硬笔书法教学计划和设计教案.doc VIP
- 《质量与密度》单元复习.doc VIP
- 中考现代文&小说阅读理解模考真题汇编含答案解析14篇.docx VIP
- 基于Python的大众点评美食网站数据采集与分析.pdf VIP
文档评论(0)