IT运维与海量日志搜索案例.pptx

下载文档 降价啦

6
0
约3.7千字
约 35页
2017-04-10 发布于湖北
举报
版权申诉
保障服务

IT运维与海量日志搜索案例.pptx

1、本文档共35页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

IT运维分析与海量日志搜索日志易CEO 陈军提纲 IT 运维分析（IT Operation Analytics）日志的应用场景过去及现在的做法日志搜索引擎日志易产品介绍 IT 运维分析从 IT Operation Management (ITOM) 到 IT Operation Analytics (ITOA) 大数据技术应用于IT运维，通过数据分析提升IT运维效率可用性监控应用性能监控故障根源分析安全审计 Gartner估计，到2017年15%的大企业会积极使用ITOA；而在2014年这一数字只有5% ITOA 的四种数据来源机器数据（Machine Data）日志通信数据（Wire Data）网络抓包，流量分析代理数据（Agent Data）在 .NET/Java 字节码里插入代码，统计函数调用、堆栈使用探针数据（Probe Data）在各地模拟ICMP ping、HTTP GET请求，对系统进行检测 ITOA 四种数据来源使用占比 ITOA 四种数据来源的比较机器数据（日志）日志无所不在但不同应用输出的日志内容的完整性、可用性不同通信数据（网络抓包）网络流量信息全面但一些事件未必触发网络流量代理数据（嵌入代码）代码级精细监控但侵入性，会带来安全、稳定、性能问题探针数据（模拟用户请求）端到端监控但不是真实用户度量（Real User Measurement）日志，我们重要的数据资产 IT系统（服务器、网络设备）每天都产生大量的日志，包含了各种设备、系统、应用、用户信息日志：时间序列机器数据带时间戳的机器数据 IT 系统信息服务器网络设备操作系统应用软件用户信息用户行为业务信息日志反映的是事实数据 “The Log: What every software engineer should know about real-time datas unifying abstraction”, Jay Kreps, LinkedIn engineer 深度解析LinkedIn大数据平台（/article/2014-07-23/2820811/1）一条 Apache Access 日志 43 - - [15/Apr/2015:00:27:19 +0800] “POST /report HTTP/1.1” 200 21 “/search/” “Mozilla/5.0 (Windows NT 6.1; WOW64; rv:37.0) GeckoFirefox/37.0” “74” 0.005 0.001 字段： Client IP: 43 Timestamp: 15/Apr/2015:00:27:19 +0800 Method: POST URI: /report Version: HTTP/1.1 Status: 200 Bytes: 21 Referrer: /search/ User Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:37.0) GeckoFirefox/37.0 X-Forward: 74 Request_time: 0.005 Upstream_request_time:0.001 日志的应用场景运维监控可用性监控应用性能监控 (APM) 安全审计安全信息事件管理 (SIEM) 合规审计发现高级持续威胁 (APT) 用户及业务统计分析过去日志没有集中处理登陆每一台服务器，使用脚本命令或程序查看日志被删除磁盘满了删日志黑客删除日志，抹除入侵痕迹日志只做事后追查没有实时监控、分析使用数据库存储日志无法适应TB级海量日志数据库的schema无法适应千变万化的日志格式无法提供全文检索近年 Hadoop 批处理，不够及时查询慢数据离线挖掘，无法做 OLAP (On Line Analytic Processing) Storm/Spark Hadoop/Storm/Spark都只是一个开发框架，不是拿来即用的产品 NoSQL 不支持全文检索现在对日志实时搜索、分析日志实时搜索分析引擎快日志从产生到搜索分析出结果只有几秒的延时大每天处理 TB 级的日志量灵活 Google for IT，可搜索、分析任何日志 Fast Big Data 日志3.0：实时搜索引擎需要开发成本批处理，实时性差不支持全文检索固定的schema无法适应任意日志格式无法处理大数据量日志2.0： Hadoop 或 NoSQL 日志1.0：数据库日志管理系统的