HFP-growth算法在wap日志挖掘上的应用分析.pdfVIP

  • 7
  • 0
  • 约5.01万字
  • 约 38页
  • 2019-06-18 发布于安徽
  • 举报

HFP-growth算法在wap日志挖掘上的应用分析.pdf

目 录 目 录 第一章 引言…………………………………………………………………………1 1.1研究背景及意义…………………………………………………………….1 1.2国内外研究现状…………………………………………………………….2 1.3本文主要内容.……………………….…_………..-。…………….....一..._…3 第二章数据挖掘和Web日志挖掘综述…………………………………………..4 2.1数据挖掘…………………………………………………………………….4 2.2Wreb挖掘…………………………………………………………………………..5 2.3W.eb日志挖掘………………………………………………………………..7 第三章WAP日志的预处理技术…………………………………………………一9 3.1预处理介绍………………………………………………………………….9 3.2WAP日志……………………………………………………………………10 3.3预处理流程…………………………………………………………………13 第四章关联规则挖掘算法……………………………………………………….19 9 4.1关联规则挖掘………………………………………………………………1 4.2 Apriori算法………………………………………………………………………………………20 4.3FP.GROWTH算法…………………………………………………………………………….22 4.4 HFP.GROWTH算法……………………………………………………….24 4.5算法的比较…………………………………………………………………25 第五章无线数据分析系统介绍………………………………………………….27 5.1开发环境及数据源…………………………………………………………27 5.2系统设计……………………………………………………………………27 5.3系统实现……………………………………………………………………27 5.4系统评价……………………………………………………………………34 第六章总结……………………………………………………………………….36 6.1本文所做工作………………………………………………………………36 6.2展望…………………………………………………………………………………………………36 目 录 致谢……………………………………………………………………………….38 参考文献…………………………………………………………………………….39 IV 第一章引言 第一章 引言 1.1研究背景及意义 互联网的发展速度是惊人的,它给每个人的生活都带来了巨大影响力,也 提供了很多使得,让人们足不出户,便可以浏览天下大事。当时,也给人类的 工作减轻了不少负担,现在几乎人人都离不开互联网了。人们在网上搜索资源 也发布资源,Web成了人们工作学习的交流平台,里面存储了大量丰富的用户 数据,并且一日千里的速度增长着。 但是,这种速度使得信息量过载,并且很多有用的信息可能都淹没在这海 量的数据中了。面对这些浩如烟海,并日益增长的数据,如何挖掘出有利用价 值的信息变的更加迫切了。但是Web数据跟普通的数据不同,它具有异构、分 布式和动态等特点,Web数据的复杂性使得它不同于普通的文档挖掘,而且海 量的数据中可能只有很小的一部分数据是对你所感兴趣的东西是有用的,或者 只有很小的一部分数据显示是相关的,所以需要特别研究针对它的技术。 数据挖掘技术的发展正是顺应了这种海量数据分析的需求,而W|eb数据挖 掘更是数据挖掘中应对互联网产生的分枝,也是应用最广泛的一方面。从网络 服务器等各地方的日志数据中,抽取出企业或个人感兴趣的东西十分有价值, 如用户

文档评论(0)

1亿VIP精品文档

相关文档