- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据处理的lambda架构_深圳光环大数据培训机构
光环大数据--大数据培训人工智能培训
大数据处理的Lambda 架构_深圳光环大数据培训机构
1.Lambda 架构配景先容
Lambda 架构是由Storm 的作者Nathan Marz 提出的一个及时大数据处置框架。Marz 在
Twitter 事情时代开辟了闻名的及时大数据处置框架Storm,Lambda 架构是其依据多年进行
分布式大数据体系的经验总结提炼而成。
Lambda 架构的目的是计划出一个能满意及时大数据体系症结特征的架构,包含有:高
容错、低延时和可扩展等。Lambda 架构整合离线盘算和及时盘算,交融弗成变性
(Immunability),读写分离和繁杂性断绝等一系列架构准则,可集成Hadoop,Kafka,Storm,
Spark,Hbase 等各种大数据组件。
2.大数据体系的症结特征
Marz 觉得大数据体系应具备如下的症结特征:
Robust and fault-tolerant (容错性和鲁棒性):对大规模分布式体系来讲,机械是弗
成靠的,可以或许会当机,然则体系必如果硬朗、行动准确的,即使是碰到机械差错。除机
械差错,人更可以或许会犯差错。在软件开辟中不免会有一些Bug,体系必需对有Bug 的法
式写入的差错数占有充足的顺应能力,以是比机械容错性加倍紧张的容错性是工资操纵容错
性。对付大规模的分布式体系来讲,人和机械的差错天天均可以或许会发生,若何应答人和
机械的差错,让体系可以或许从差错中疾速规复特别紧张。
Low latency reads and updates (低延时):许多应用对付读和写操纵的延时哀求非常
高,哀求对更新和查问的相应是低延时的。
Scalable (横向扩容):当数据量/ 负载增大时,可扩展性的体系经由进程增长更多
光环大数据
光环大数据--大数据培训人工智能培训
的机械资本来保持机能。也便是常说的体系必要线性可扩展,平日采纳scale out (经由进程
增长机械的个数)而不是scale up (经由进程加强机械的机能)。
General (通用性):体系必要可以或许顺应普遍的应用,包含金融领域、交际收集、
电子商务数据分析等。
Extensible (可扩展):必要增长新功效、新特征时,可扩展的体系能以最小的开辟
价值来增长新功效。
Allows ad hoc queries (便利查问):数据中包含有价值,必要可以或许便利、疾速
的查问出所必要的数据。
Minimal maintenance (易于保护):体系要想做到易于保护,其症结是节制其繁杂
性,越是繁杂的体系越容易失足、越难保护。
Debuggable (易调试):当出成绩时,体系必要有充足的信息来调试差错,找到成
绩的本源。其症结是可以或许追根溯源到每一个数据天生点。
3.数据体系的本色
为了计划出能满意前述的大数据症结特征的体系,咱们必要对数据体系有本色性的懂得。
咱们可将数据体系简化为:
数据体系 = 数据 + 查问
从而从数据和查问两方面来熟悉大数据体系的本色。
3.1.数据的本色
3.1.1.数据的特征:When What
光环大数据
光环大数据--大数据培训人工智能培训
咱们先从“数据”的特征谈起。数据是一个弗成分割的单元,数占有两个症结的性子:
When 和What 。
When 是指数据是与光阴相干的,数据必定是在某个光阴点发生的。好比Log 日记
就隐含着依照光阴前后顺序发生的数据,Log 后面的日记数据必定先于Log 后面的日记数据
发生;新闻体系中新闻的接受者必定是在新闻的发送者发送新闻后接收到的新闻。比拟于数
据库,数据库中表的记载就丧失了光阴前后顺序的信息,中央某条记载可以或许是在末了一
条记载发生后发生更新的。对
您可能关注的文档
- 带输入滞后/时滞的多智能体一致性控制 consensus control of multi-agent systems with input delay.pdf
- 贷款门槛太高 金融机构影响二手车信贷起色.pptx
- 贷款信誉保险在小额贷款中的作用了解.doc
- 袋鼠云数据智能业务简介.pdf
- 袋装货物的装箱技巧.ppt
- 大一基化条记.doc
- 大鱼集群存储体系-高清非编计划.pdf
- 大智通股票软件代理讲明书.ppt
- 大众1.4t.doc
- 大众lavida朗逸如何样?全方位简介.docx
- 师缘主题课件最新完整版本.pptx
- 基于偏好MOEA_D算法的气发动机多目标优化标定研究.pdf
- 师范技能课件比赛一等奖最新完整版本.pptx
- 师范生初中美术说课课件最新完整版本.pptx
- 师范技能课件图片素材库最新完整版本.pptx
- Unit 2 Making a Difference Understanding ideas The Well that changed the world 教学设计-高中英语外研版(2019)必修第三册.docx
- 师范生技能大赛PPT课件语文最新完整版本.pptx
- 基于扭矩的双燃料发动机控制策略研究.pdf
- 1.2.1 等差数列的概念及其通项公式(教学设计)高二数学(北师大版2019选择性必修第二册).docx
- 师范文化课件最新完整版本.pptx
文档评论(0)