Storm在用户搜索分析中的应用.pdfVIP

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Storm在用户搜索分析中的应用.pdf

Storm在用户搜索分析中的应用 - y_~l】冰 (福建富士通信息软件有限公司 福建 350003) 【摘 要】大数据的出现,对计算的处理能力要求越来越高,除了批量数据的处理之外,有很多业务要求处理数据的实 时性较高,比如在毫秒级的处理速度。互联网数据是典型的大数据,从这些数据中进行有价值的数据挖掘就是大数据常见的 应用,本文主要介绍了基于从用户所有网站访问数据中分析用户的搜索行为这个业务场景,利用Storm技术的低延迟、高性 能、分布式、可扩展、容错等特点,在 storln的框架上开发应用程序解决需求的方法。 【关键词】流计算;分布式;实时;容错 中图分类号 :TP391.3 文献标识码:A 文章编号:1009—6833(2014)11—064—02 ApplicationofStorm intheanalysisofusers’search W angJianbing Abstract:Theemergenceoflargedatatocalculatetheprocessingpowerofdemandishigherandhigher,besidesthebatchdata processing,therearealotofbusinessrequirereal—timeprocessingdataishigher,suchastheprocessingspeedofmillisecond.Internet dataistypicalofbigdata,valuabledatarfom thedatami ningisacommonapplicationdata,thispapermainlyintroducesthebasedon theanalysisfrom theusersallaccesstothedataofusers’searchbehaviorthisbusinessscenario,low latency,highperformanceofStorm , distributed,scalable,faulttolerance,etc,intherfameworkofStomr onapplicationdevelopmentsolutionstorequirements. Keywords:Flow calculation;Distributed;Inrealtime.Faulttolerance 0 引言 Topology:Stomr 中运行的~个实时应用程序,因为各个组 在大数据的时代里,互联网以及公司的日常运营经常会生 件间的消息流动形成逻辑上的一个拓扑结构。 成 TB级别或以上的数据,大数据来源囊括了网站、社交媒体、 Spout:在一个 Topology中产生源数据流的组件 。通常情 交易型商业数据以及其它商业环境中创建的数据。在大数据的 况下Spout会从外部数据源 中读取数据,然后转换为 Topology 业务场景中,有批量分析的场景,这些分析以大多以长期积累 内部的源数据 。Spout是一个主动的角色,用户只要在其中生成 的大量数据为基础进行各维度的统计,也有很多需要实时的处 源数据即可。 理的场景,如用户上淘宝网站时给用户推荐的商品,用户的手 Bolt:在一个Topology中接受数据然后执行处理的组件。 机移动到某个商圈时给用户推送的优惠消息等 ,这些实时的处 Bolt可以执行过滤、函数操作、合并、写数据库等任何操作。 理往往要求处理的时长在毫秒级甚至更低 ,因为只有在这样的 Bolt是一个被动的角色,用户可以在其中执行 自己想要的操作 。 处理时限内结果才有意义。

文档评论(0)

kittymm + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档