Hadoop应用高级篇之用户行为实时获取与分析.pptxVIP

Hadoop应用高级篇之用户行为实时获取与分析.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Hadoop应用高级篇之用户行为实时获取与分析李锋从事软件开始12年,主要的业务领域在航空业与金融业,近几年主要从事大数据领域应用开发与运维我们的网站受到攻击业务目标网站总体情况网站的部署结构抓住恶意用户思考如何完成上级交给的任务如何解决数据量的问题?如何解决数据的实时性?如何解决系统的扩展性?开始应用程序部署架构图部署前端监控脚本部署实时数据流处理中枢部署hadoop集群部署hive应用部署业务处理我们的网站受到攻击业务目标网站整体情况网站总体架构业务目标 现在公司的销售网站被恶意用户攻击,需要作为架构师的你提供一个解决方案,需要能够对简单的恶意行为在10s内做出反应,对复杂的恶意行为10分钟内做出反应。需要网站能够7X24小时不间断运行,减少公司的损失,提高网站销售量网站总体情况关键特性网站群总的访问量:每日1500千万PV网站群独立访问数量:每日10万独立IP网站群每日的访问日志:每日30Gb网站群高峰的访问量:4000pv/mins网站的部署结构抓住恶意用户思考如何完成上级交给的目标?思考如何完成上级交给的目标?重点考虑的几个方面:1) 面临的数据量大小2) 实时性的要求有多高3) 系统的扩展性如何4) 实施成本有多少如何解决数据量的问题?当前情况,每天1500万的访问量未来要是,每天15亿次的访问量?该如何做?如何解决数据的实时性? 每分钟峰值时候需要处理40000条用户行为数据Apache Kafka网站监控脚本未来要是,每分钟峰值需要处理50万次?该如何做?如何解决系统的扩展性?系统的中枢神经在哪里?Apache KafkaKafka分布式消息系统,具有非常好的扩展性能。通过,zookeeper的支持下分布式的部署,可以动态进行计算能力升级以及异常节点的下线处理,具有很好的扩展性以及高吞吐量。在3台普通PC服务器(双路16核,16G内存)的集群架构下,可以支持每秒钟50万的吞吐量。实时数据监控部署结构用户行为监控双管齐下1)互联网用户访问信息(浏览器指纹技术)2)网站请求信息开始部署应用程序部署前端监控脚本与采集服务

文档评论(0)

独角戏 + 关注
实名认证
文档贡献者

本人有良好思想品德,职业道德和专业知识。

1亿VIP精品文档

相关文档