网站流量分析项目数据收集与处理流程说明.pdfVIP

网站流量分析项目数据收集与处理流程说明.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

日志收集模块说明

日志收集的目的最终是把用户对目标的日志汇聚到HDFS文件系统中的特定目录,以便给下一步的

数据模块进行处理。要完成这一工作,需要分为如下几个步骤去做:

JS

日志服务器

日志切割

日志收集

下面对上述四个步骤一一进行详细说明:

1.JS

我们需要收集某个第访站的情况,通用的做法是在第的相关页面嵌入一个JS,这样当用

目录,以便给下一步的

嵌入一个JS,这样当用

户该页面时,页面上的JS会在页面上动态加入一个image/,并且image/的src属性指向日志服务

器下的一个透明的URL地址,在该URL参数上会附带第的一些信息(如被页面的URL、识别用户

的等),这样通过分析日志服务器(一般是nginx或apache)的access日志文件就能获取到这些信息。

这个JS的可以自己编写来实现,代码片断如下:

functionar_main(){

varunit_id=9999;//第id

//日志服务器地址

vardest_path=+unit_id;

varexpire_time=1800;

vari;

//通过获取UV信息

e/的src属性指向日志服务

页面的URL、识别用户

文件就能获取到这些信息。

id=+unit_id;

//返回导航到当前网页的超所在网页的URL

//获取当前页面的URL

//获取屏幕信息

//获取是否使用JAVA和flash

//拼接日志服务器的URL

dest=dest_path+url=+url+urlname=+urlname+title=+title+chset=+charset+scr=+scre

en+col=+color+lg=+language+je=+jvm_enabled+ec=+_enabled+fv=+flash_ver+cnv

=+String(Math.random())+ref=+ref+uagent=+agent+stat_ss=+uv_id+stat_uv=+stat_uv;

dest+=ar_join_clientInfo();

//在当前用户的页面上动态添加一个image/,并设置其src为日志服务器下的一个透明的URL

vardom=$(imgsrc=\+dest+\border=\0\width=\1\height=\1\/);

=+charset+scr=+scre

+fv=+flash_ver+cnv

stat_uv=+stat_uv;

个透明的URL

\/);

document.body.appendChild(dom.get(0));

}

//执行

ar_main();

此外这个js的我们也可以考虑用第开源的产品,这样这些开源产品会自动帮助我们出分析结果,这

样的产品有:

谷歌的Analytics,其源码地址:,

使用说明:

腾讯云分析平台,

动帮助我们出分析结果,这

文档评论(0)

135****9250 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档