- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一淘及搜索事业部 阿里搜索引擎技术峰会 一淘及搜索事业部 阿里搜索引擎技术峰会 一淘及搜索事业部 引擎平台统一之路 阿里搜索引擎技术峰会 iSearch3 iSearch3 kingso iSearch5 2013 一淘及搜索事业部 阿里搜索引擎技术峰会 THANK YOU! 搜索离线生产集群中的流计算 提纲 搜索离线系统技术体系 Hadoop-2.0 YARN介绍 Stream Service 计算模型 Stream Service 服务调度 Stream Service 运维操作 * 搜索离线系统技术体系 * HDFS YARN HBase MapReduce Stream Service HQueue 搜索离线业务 网页抓取 数据处理 数据统计 Pig Hive 数据挖掘 ……. Hadoop-1.0 VS Hadoop-2.0 * Applications on YARN * Stream Service 计算模型 基本概念 拓扑结构 消息管理 进度管理 编程接口 * 基本概念 Stream Service:完成一套业务功能的流计算服务 Stream Role:1个Role表示1组具备相同计算功能的计算单元 Stream Worker:Stream Role中的计算单元 Stream Source:Stream Worker的数据输入源 Stream Sink:Stream Worker的数据输出终端 Stream Master:负责调度管理Stream Workers * 拓扑结构 * Stream Source Stream Sink/Source Stream Sink/Source Stream Sink Stream Source Stream Source Stream Role Stream Role Stream Role Stream Role 分布式消息队列(HQueue等) HBase,iSearch等 MySQL DRC, TT等 消息管理 Stream Service的设计理念:计算和存储分层,计算之间解耦 计算层之间采用持久化分布式消息队列进行消息传递 消息不会丢失 消息队列可自由选择 优势 消息管理机制简单,系统OverHead消耗少,吞吐量大 上下游计算解耦,不相互阻塞进度,方便新业务接入 持久化的消息流,方便多业务共享数据以及问题追查 * 进度管理 流进度基于时间轴(消息生成时间 vs 消息处理时间) Master WebUI展示Workers进度 Master监控Workers进度(进度过慢进行报警) Worker定期将进度CheckPoint到ZK Worker重启从ZK上的CheckPoint进行恢复 * 编程接口 InputFormat:Stream Source(例如:DRC,TT, HQueue)的操作封装 getSplits(Source):为Stream Source进行数据分片拆分 createReader(Split):为Data Split创建Reader reader.next():流式读取消息 * Split Split Split Split Stream Source reader reader reader reader message message message message 编程接口 Worker:定制消息业务处理逻辑 setUp():消息处理前的初始化工作 cleanUp():消息处理结束后的清理工作 process(message):消息一条条处理 * 编程接口 Router:消息的路由策略 getSinks(message):获取消息的输出sink列表,决定消息向那里路由发送 * Stream Worker Stream Sink Stream Sink Stream Sink message Router 编程接口 OutputFormat:Stream Sink(例如:HBase,HQueue等)的操作封装 createWriter(Sink):为Stream Sink创建Writer writer.write(partitionID, message):向Stream Sink写消息,并按PartitionID进行打散分发 Partitioner:消息的分发策略 getPartition(message):获取消息的partitionID,根据此partitionID决定如何分发打散 * partition partition partition partition Writer Stream Sink message partitionID 服务调度 一级调度,资源调度管理 YARN Resource Manager - Stre
您可能关注的文档
- PC工艺方案演示文稿.ppt
- 热处理工艺钢的热处理举例处理教学课件.ppt
- 《材料成型工程综合试验》焊接工艺评定课件.ppt
- 玻璃深加工生产管理培训课件.ppt
- 应对新的国家饮用水水质标准的现有水厂工艺改造技术对策演示文稿.ppt
- 加强外委工程管理 确保风险可控在控演示文稿.ppt
- 项目六泵盖类零件的数控加工工艺编制与实施教学课件.ppt
- 从实证角度浅谈哺乳母猪饲养管理要点课件.ppt
- 2-1成型工艺教学课件.ppt
- 第八章饭店业务管理课件.ppt
- 2025年拍卖师慈善拍卖项目整体策划与方案设计专题试卷及解析.pdf
- 2025年拍卖师从危机中寻找机遇的品牌重塑策略专题试卷及解析.pdf
- 2025年拍卖师房地产在建工程拍卖的成交确认专题试卷及解析.pdf
- 2025年拍卖师后疫情时代消费心理与投资偏好对拍卖市场的影响分析专题试卷及解析.pdf
- 2025年拍卖师激励性语言的文化适应性专题试卷及解析.pdf
- 2025年拍卖师拍卖纠纷处理中的心理学应用专题试卷及解析.pdf
- 2025企业人力资源劳动合同模板.docx
- 2025年拍卖师拍卖APP的用户体验与沟通设计专题试卷及解析.pdf
- 2025年拍卖师应对竞买人恶意串通与围标的控场策略专题试卷及解析.pdf
- 基于神经网络的混合气体检测分析系统.pdf
最近下载
- 人教版(2024)新教材小学三年级美术上册第三单元《爱集体爱劳动--传承中华美德》每节课精品教案汇编(含三个精品教案).doc
- 类风湿性关节炎临床路径.pdf
- 管综模拟卷(四)答案.pdf VIP
- 机器人切割设备操作工岗位职责说明.doc VIP
- Q-CR 562.4-2018-铁路隧道防排水材料 第4部分:排水盲管与检查井.pdf VIP
- 《培养小学生合作学习能力的研究》中期汇报材料.docx VIP
- 农业保险+期货介绍.pptx VIP
- 11《我们都是热心人》第2课时(课件)2025道德与法治三年级上册统编版.pptx
- 管综模拟卷(三)答案.pdf VIP
- 疾病控制中级(归纳总结)..doc VIP
原创力文档


文档评论(0)