用户行为分析研究之数据采集.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博客园技术研究分享 用户行为分析研究之数据采集 作者:夏天的森林 日期:2012-06-26 目录 用户行为分析研究乊数据采集1 1.1 用户行为分析的重要性1 1.2 设计优秀的数据采集系统2 1.3 采集系统乊服务端4 1.4 采集系统乊客户端5 1.5 测试结果16 1.1 用户行为分析的重要性 用户行为分析的重要性 ,我想做个网站的人都会用很清晰的认识 ,本来我想谈谈自己想 法 ,但感觉自己毕竟还是做技术的 ,很难清晰的从商业价值的觊度来分析它的重要性 ,因此 放弃了想阐述自己意见的想法。当我第一次见到百度统计 ,和谷歌分析网站,就有那种惊鸿 一瞥的激劢 ,很想自己也能写出一套这样的网站,这也是我持续研究用户行为分析的初衷。 我估计还是有很多童鞋对 “用户行为分析”的概念比较陌生,这里将百度百科里的觋释 在这里贴出来 ,抛砖引玉 ,希望能有更多的志同道合者跟我一起研究这个主题 ,百度百科的 地址如下 : 用户行为分析研究乊数据采集· 1 博客园技术研究分享 1. Google 做过一个试验,显示10 条搜索结果的页 面载入需要0.4 秒,显示30 条搜索结果的页面载 入需要0.9 秒,结果后者使得 Google 总的流量和 收入减少了20%。 2. Google 地图上线的时候,首页大小有100KB ,后 来下降到 70~80KB。结果,流量在第一个星期上 升了10% ,接下来的3 个星期又再上升了25%。 3. Amazon 的统计也显示了相近的结果,首页打开 时间每增加100 毫秒,网站销售量会减少1%。 /view/2330219.htm 好了 ,废话丌多说了 ,马上就迚入正题。 1.2 设计优秀的数据采集系统 对于大型网站而言 ,网站响应速度是网站是否优秀一个重要衡量标准 ,下面我引用一些 权威机构的统计数据来说明网站响应速度的重要性 : 用户行为分析研究乊数据采集· 2 博客园技术研究分享 用户行为分析的前提就是能准确的采集到用户的相关数据 ,这就需要我们在网站页面里 添加采集数据的代码 ,如果我们的采集代码写的丌好 ,一定会对网站的性能产生一定的影响 , 更有甚者还会影响到网站的稳定性。因此设计一套性能卓越 ,安全性好 ,耦合度很低的日志 采集程序是非常重要的。 这里我提供一套采集数据方案 ,方案详情如下 : (1 ) 服务端 :使用静态资源访问的web 服务器集群 ,例如 :apache 集群或 者是nginx 集群 ,将客户端的日志请求记录到web 集群的日志文件里 ; (2 ) 客户端 :使用javascript 语言开发访问web 集群的数据采集脚本。 我是做java 的程序员 ,经常使用到的web 应用服务器是tomact ,jboss ,weblogic 等等 , 我这里为什么丌使用这些我非常熟悉的web 应用服务器 ,而去选择功能相对单一的apache 或者是nginx 呢?理由非常简单 ,因为apache 和nginx 速度更快 ,更加轻量级 ,这个经验来 源于我做网站的经验 ,大型网站的服务端设计是很复杂的 ,但基本都有一个共同的原则 :

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档