NPLWAP一种新的Web序列模式挖掘算法.docxVIP

  • 3
  • 0
  • 约1.34万字
  • 约 11页
  • 2017-09-12 发布于重庆
  • 举报
NPLWAP:一种新的Web序列模式挖掘算法 林维仲,张东站基金项目:国家自然科学基金项目 *通信作者:zdz@ (厦门大学 数据库实验室,信息科学与技术学院,福建 厦门 361005) 摘要:Web序列模式挖掘是将数据挖掘技术应用于Web访问序列,通过对Web访问序列的模式挖掘可以发现用户与网站交互的频繁模式,利用这些模式可以建模并分析用户与网站交互的模型,进而预测未来的访问模式,这对于构建智能化Web站点和开展电子商务活动有非常重要的意义。本文介绍了传统的PLWAP算法,并在此基础上提出了一种对PLWAP算法中Header Table的新的构建方法的改进算法NPLWAP。在NPLWAP算法中Header Table的构建过程中每一步都只基于当前处理的节点的后缀树集,且Header Table并不存储所有的后缀树集节点,而是只存储后缀树集根节点,从而减少挖掘过程的相关判断。通过对真实数据的实验对比可以看出NPLWAP算法在运行时间上比传统的PLWAP算法有了很大的改进。 关键词:Web数据挖掘;序列模式;PLWAP-Tree;NPLWAP 中图分类号:TP311.13 文献标识码:A 随着电子商务、Web服务以及基于Web的信息系统的持续发展和壮大,基于Web的组织在日常运作中已经收集了大量的点击流和用户数据。对这些数据的分析可以用于优化Web应

文档评论(0)

1亿VIP精品文档

相关文档