为什么日志分析是开始使用大数据的好(坏)起点.PDFVIP

  • 5
  • 0
  • 约 2页
  • 2017-08-29 发布于江苏
  • 举报

为什么日志分析是开始使用大数据的好(坏)起点.PDF

为什么日志分析是开始使用大数据的好(坏)起点

为什么日志分析是开始使用大数 据的好(坏)起点 英文原文: /2012/05/why-log-analytics-is-a-great-and-awful-place-to-start-with-big-d ata/ 了解采用结构化数据的 Hadoop 的利与弊 作者:Tom Deutsch 发表日期:2012 年 5 月 23 日 首先,我们来定义一下日志分析的含义。最常见的日志分析用例是运用 Apache Hadoop 处 理机器生成的日志(通常是指 Web 应用程序及支持 Web 应用程序的点击流)。日志分 析需要摄取大量半结构化信息,然后将这些信息汇集成更加易于使用的数据集,并从交互中 总结重要信息。(广告位)日志处理是创造 Hadoop 的核心用例,因此它能够在这个场景 中正常运转一点也不奇怪。 Google、Yahoo 及许多其他 Internet 属性均通过业务模型运行,采用的业务模型在很大程 度上依赖于这些操作而且效果确实不错。不过,绝大部分公司在发生 Web 事件时无法及 时获悉,而是需要经历一定的延迟(不是以小时或天来计算,而是动辄持续数周)才能通过 单击或网络日志行为了解这一情况。由于起点极低,因而实现大幅改观并不困难。 此外,由于大多数公司不愿停用现有的数

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档