模式恢复算法在Web使用挖掘中的应用.pdfVIP

模式恢复算法在Web使用挖掘中的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
点击下一访 问过的页面 ,直到 landingpage。 xmlns=IThttp://schemas.microsoft.com/AspNet/SiteMap—File-1.0 山峰模式 :该模式为上行阶梯械和下行阶梯模式的组 ” 合,一般表示用户到达某一页面之后,再沿原访问路径返回 siteMapNodeurl=”/index”tit】e=”Home” 到 lnadingpage。 siteMapNodeurl=”/accottnt/login’title=”Yogin’ 手指模式 :该模式表示,用户从lnadingpage点击进入 siteMapNode url=’’/account/register” title= 某此过程。一页面,停留一段时间之后再次进人 landingpage, ”Register” description=””/ 然后再次进入新的页面,不断地重复。 /siteMapNode 1.2 组合 日志格式(CombinedLogFormat) /siteMap 组合 日志格式(CombinedLogForm~)是将通用 日志格式 2 点击流数据的缺失问题 (CommonLogFornaat)~n其它部分信息组合而成的Web日志 在 Web使用挖掘中,一般有两类数据来源:客户端数据 格式。Apache服务器通过配置可以产生这一格式的Web访 和服务器端数据。客户端数据的收集,一般是通过在页面文 问日志。 档中插入一小段脚本程序来完成的。用户在客户端的所有浏 通用 日志格式:主要包含以下几部分信息,缺失部分则 览行为都可以被客户端脚本程序记录并且发回到服务器端, 用 “.”表示。 因此客户端数据一般是不会发生缺失的。但是相对于客户端 (1)访 问者 IPl 数据,在 Web使用挖掘中使用更广泛的则是服务器端数据, (2)访问者用户名; 也就是点击流数据。由于对数据的记录发生在服务端,因此 (3)访问日期; 会有多种因素导致点击流数据的缺失。 (4)访 问路径 ; 2.1 用户浏览器造成的点击流数据缺失 (5)HTTP状态码; 在众多造成点击流数据缺失的因素中,用户浏览器是影 (6)访问者所请求文档大小,以字节表示。 响最为广泛的一种。现代浏览器几乎全部使用缓存机制。即 以下是一条实际的通用 日志格式的访问记录实例 当用户初次向Web服务器请求一份页面文档之后,该页面文 127.0.0.1 · [08N/ov/2011:05:37:49 -0800] ”GET 档所包含的元素(图片,样式文件,脚本文件等)甚至是页面 /account/login.htm HTTP/1.1”2002758 文档本身都会被浏览器缓存起来。 组合 日志格式:在通用 日志格式的基础上,组合添加了 当用户接下来通过在地址栏输入地址或是点击刷新按 两条重要的信息,分别是: 钮再次请求同一页面文档的时候,浏览器会首先尝试向Web (1)HTTPReferer,表示访问者在来到当前页面之前所在 服务器询问部分元素内容是否变动,如果没有变动 ,则服务 的页面 器会向浏览器发送一个状态码为 304的HTTP回复,指示该 (2)User-agent,客户端浏览器标识 元素内容没有变动,则浏览器不用再次请求该元素,则使用 以下是一条实际的组合 日志格式的访问记录实例 缓存中的内容来呈现给用户。在此情形下,虽然浏览器并没 12

文档评论(0)

fengyu11 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档