- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于基于SStorm利用空闲资源利用空闲资源
构建实时计算平台构建实时计算平台
肖康
主要内容
• 背景
• 挑战挑战
•• stormstorm问题与改进问题与改进
• storm应应用可用性保证性保证
背景
• 为什么要构建另一个分布式计算平台
– MapReduce为批处理设计,但时效性不好
– 不能方便的支持多阶段处理,如m-r1-r2-r3
– 业务有时效性需求
– 需要实时流式处理能力
– 往往需要多个逻辑串起来
背景
• 为什么要选择storm
– storm是一个实时、流式计算系统
– 天然支持DAG计算模型
• 为什什么要利用空闲资资源
– 大量云存储服务器主要使用磁盘资源
– 而而CPU、、网络资源比较网络资源比较空闲闲
背景
• storm在360的发展历程 09091212010106060707
1个4节点 复用一个云 大量复用云 走向平台化管理 探索实时、可靠性
专用集群 存储集群 存储集群 随着云存储扩容 要求更高的业务
测试日志 云盘缩略图 日志实时分 广泛应用: 网页、 (如实时计费)
报警应用 应用 析等应用 图片、安全...
背景
• 机器数
– 60多个集群,15000多台物理机
– 利用云存储空闲资源,每台机器贡献1-2核、1-2G内存
• 应用应用
– 170多个业务
• 实时日志统计、网页分析、图片处理 、人脸识别...
– 每天处理数据量约几百TB、几百亿条
背景
• 典型应用:网络相册缩略图
背景
• 典型应用:时效性网页收录
背景
• 典型应用:搜索热词推荐
背景
• 典型应用:在线验证码识别
背景
• 典型应用:实时网络入侵检测
光纤旁路 MQ
scribe
输输入
spout
拦截
特征匹配 异常行为
统计bolt
bolt 检测bolt
拦截 输出输出
模块模块
挑战
• 如何做到不影响已有业务的运行
– 机器复用必然带来资源竞争
• 如何保证storm平台的稳定性
– 遇到哪遇到哪些storm已知问题知问题、、如何解决如何解决
– 怎么提前发现、防范未知问题
• 如何保证实时业务的可用性
– ((准准))实时业务对可用性要求更高实时业务对可用性要求更高
– 空闲资源的资源可靠性更低
挑战
• 如何做到不影响已有业务的运行
– 利用cgroup做单机资源隔离
– 包括CPU、内存、网络
– killall模式防止进程残留
– 避免本地磁盘IO
您可能关注的文档
- 互联网 云计算环境下教育等保建设思考-H3C.pdf
- 第四部分 辅助报表计算方法.pdf
- 《零起点计算机》网第9课.pdf
- 第八章 电力系统不对称故障的分析和计算.pdf
- 即时通讯云计算平台的设计思考.pdf
- 计算机操作系统标准教程 第2章 计算机网络概述.pdf
- 产品成本计算的方法.pdf
- 第1章_计算机网络基础知识.pdf
- 电缆成本计算培训手册.pdf
- 计算机网络技术及应用 第四章 计算机网络基本管理.pdf
- 2024至2030年地源热泵中央空调机组项目投资价值分析报告.docx
- 2010-2023历年黑龙江东南六校高一下学期期末联考历史卷.docx
- 2024年封口印字机项目可行性研究报告.docx
- 2024年猪肉白菜水饺项目可行性研究报告.docx
- 2010-2023历年黑龙江哈尔滨市三中高二上期期中历史试卷(带解析).docx
- 2024至2030年砚台项目投资价值分析报告.docx
- 2024至2030年中国星彩轮行业投资前景及策略咨询研究报告.docx
- 2024至2030年中国钨钢板材数据监测研究报告.docx
- 2024至2030年中国铸铁复合脱硫剂数据监测研究报告.docx
- 2024年中国数字调谐收音机控制芯片市场调查研究报告.docx
文档评论(0)