企业资源子库 知识点8:日志服务 阿里-日志服务.docVIP

企业资源子库 知识点8:日志服务 阿里-日志服务.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 8 阿里-日志服务 什么是日志服务 日志服务(Log Service,简称 LOG)是针对日志类数据的一站式服务,在阿里巴巴集团经历大量大数据场景锤炼而成。您无需开发就能快捷完成日志数据采集、消费、投递以及查询分析等功能,提升运维、运营效率,建立DT 时代海量日志处理能力。 日志服务学习路径 日志服务学习路径图为您推荐热门功能的操作指引文档,帮助您快速了解日志服务产品。视频与文档结合,全方位提升您的产品使用及文档阅读体验。 实时采集与消费(LogHub) 功能: 通过ECS、容器、移动端,开源软件,JS等接入实时日志数据(例如Metric、Event、BinLog、TextLog、Click等) 提供实时消费接口,与实时计算及服务对接 用途:数据清洗(ETL),流计算(Stream Compute),监控与报警, 机器学习与迭代计算。 查询与实时分析(Search/Analytics)实时索引、查询分析数据。 查询:关键词、模糊、上下文、范围 统计:SQL聚合等丰富查询手段 可视化:Dashboard + 报表功能 对接:Grafana,JDBC/SQL92 用途:DevOps/线上运维,日志实时数据分析,安全诊断与分析,运营与客服系统。 投递数仓(LogShipper) 稳定可靠的日志投递。将日志中枢数据投递至存储类服务进行存储。支持压缩、自定义Partition、以及行列等各种存储方式。 用途:数据仓库 + 数据分析、审计、推荐系统与用户画像。 产品架构 日志服务的架构如下图所示。 图 2-1: 产品架构 Logtail帮助您快速收集日志的Agent。其特点如下所示: 基于日志文件、无侵入式的收集日志 只读取文件。 日志文件无侵入。 安全、可靠 支持文件轮转不丢失数据。 支持持本地缓存。 网络异常重试。 方便管理 Web端操作 可视化配置 完善的自我保护 实时监控进程CPU、内存消耗。 限制使用上限。 前端服务器采用LVS + Nginx构建的前端机器。其特点如下所示: HTTP、REST协议 水平扩展 流量上涨时可快速提高处理能力。 支持增加前端机。 高吞吐、低延时 纯异步处理,单个请求异常不会影响其他请求。 内部采用专门针对日志的Lz4压缩,提高单机处理能力,降低网络带宽。 后端服务器 后端是分布式的进程,部署在多个机器上,完成实时对Logstore数据的持久化、索引、查询以及投递至MaxCompute。整体后端服务的特点如下所示意: 数据高安全性 : 您写入的每条日志,都会被保存3份。 任意磁盘损坏、机器宕机情况下,数据自动复制修复。 稳定服务: 进程崩溃和机器宕机时,Logstore会自动迁移。 自动负载均衡,确保无单机热点。 严格的Quota限制,防止单个用户行为异常对其他用户产生影响。 水平扩展: 以分区(Shard)为单位进行水平扩展。 用户可以按需动态增加分区来增加吞吐量。 三、应用场景 日志服务的典型应用场景包括:数据采集、实时计算、数仓与离线分析、产品运营与分析、运维与管理等场合。典型应用场景如下。 数据采集与消费 通过日志服务LogHub功能,可以大规模低成本接入各种实时日志数据(包括Metric、Event、BinLog、TextLog、Click等)。 方案优势: 使用便捷:提供30+实时数据采集方式,让您快速搭建平台;强大配置管理能力,减轻运维负担。 弹性伸缩:无论是流量高峰还是业务增长都能轻松应对。 图 3-1: 数据采集与消费 数据清洗与流计算 (ETL/Stream Processing) 日志中枢(LogHub)支持与各种实时计算及服务对接,并提供完整的进度监控,报警等功能,并可以根据SDK/API实现自定义消费。 操作便捷:提供丰富SDK以及编程框架,与各流计算引擎无缝对接。 功能完善:提供丰富监控数据,以及延迟报警机制。 弹性伸缩:PB级弹性能力,0延迟。 图 3-2: 数据清洗与流计算 数据仓库对接(Data Warehouse) 日志投递(LogShipper)功能可以将日志中枢(LogHub)中数据投递至于存储类服务,过程支持压缩、自定义Partition、以及行列等各种存储格式。 海量数据:对数据量不设上限。 种类丰富:支持行、列、TextFile等各种存储格式。 配置灵活:支持用户自定义Partition等配置。 图 3-3: 数据仓库对接 日志实时查询与分析 实时查询分析(LogAnalytics)可以实时索引LogHub中数据,提供关键词、模糊、上下文、范围、SQL聚合等丰富查询手段。 实时性强:写入后即可查询。 海量低成本:支持PB/Day索引能力,成本为自建方案15%。 分析能力强:支持多种查询手段,及SQL进行聚合分析,并提供可视化及报警功能。 图

您可能关注的文档

文档评论(0)

WanDocx + 关注
实名认证
文档贡献者

大部分文档都有全套资料,如需打包优惠下载,请留言联系。 所有资料均来源于互联网公开下载资源,如有侵权,请联系管理员及时删除。

1亿VIP精品文档

相关文档