改进的Web访问日志会话识别算法.pdfVIP

  • 3
  • 0
  • 约1.36万字
  • 约 4页
  • 2017-08-10 发布于北京
  • 举报
第29卷 第22期 计算机工程与设计 2008年 11月 VO1.29 NO.22 ComputerEngineeringandDesign NOV.2008 改进的Web访问日志会话识别算法 严奉华, 刘建平, 杨凡丁 (浙江理工大学信息电子学院,浙江杭州310018) 摘 要:针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方 法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。 同时通过灵活界定 内容页,并针对内容页,提 出了一些启发式规则,突破 了 “参引长度法”所固有的一个会话 中只包含一个 内容页的瓶颈。该方法提高了会话识别的准确度 ,实验结果表 明是有效的。 关键词:Web日志挖掘;数据预处理;会话; 内容页;时间阀值;启发式规则 中图法分类号:TP391 文献标识码:A

文档评论(0)

1亿VIP精品文档

相关文档