Web使用挖掘方法的的研究与改进.pdf

Web使用挖掘方法的研究与改进 摘要 Web使用挖掘方法的研究与改进 摘 要 随着数据挖掘技术的发展,人们尝试将该技术运用于Web,形成了Web挖掘技 术,Web使用挖掘就是其中一个重要的分支。Web使用挖掘通过对Web日志的分析, 获取Web上隐藏的用户感兴趣的信息,为用户提供个性化服务、信息导航,并对网 站结构的改进与优化提供依据。Web使用挖掘分为数据采集、数据预处理、模式发现 与模式分析四个阶段,其中数据预处理和模式发现是本文研究的重点。 首先,数据预处理是Web使用挖掘的一个难点。它分为数据清洗、会话识别、 路径补充、事务识别四个阶段。本文在会话识别阶段,提出了基于DFA方式的会话 识别。在路径补充阶段,提出了一种基于多窗口方式的路径补充。并在此基础上,构 造了可用于动态框架网站会话识别的SRDFA。在事务识别阶段,本文改进了事务识 别方法中的最大向前路径法,在事务识别阶段记录可能需要添加的超链接。 其次,模式发现也是一个重要的阶段。在这个阶段中,本文给出了一种改进的 到挖掘出用户需要的频繁项集后终止。 此外,本文设计了两个验证性实验,证明了整个处理框架的可行性。最后,本文 将整个处理方法运用于一个真实的MVC模式下的struts框架网站,在实践中证明了 此方法的有效性和实用性。 本文对Web使用挖掘部分算法的改进具有一定的现实意义。首先,它对会话识 别和事务分割方法的研究以及部分数据挖掘算法的改进具有一定的参考价值,在一定 程度上推动了Web使用挖掘算法的研究;其次,它也促进了Web访问行为分析、网 站结构分析和网站结构优化等方面的研究。 关键字:W-eb使用挖掘、会话识别、路径补充、关联规则、Apriori算法 作者:黄金晶 导师:杨季文 Abstract Researchand onWeb ImprovementUsage Mining Researchand entonWeb Improvem UsageMining Abstract Researchersdata tOresearchsonweb since applyminingtechnologies technologies data are resultsinanewresearchareacalled miningtechnologies developed.It rapidly web and retrieveshidden imformation mining.Webusagemining,which interesting by webserver oneofthe branchesofweb anlaysing log,is important mining.Itprovides individuationand ofweb to isthefound

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档