- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Web日志挖掘技术的研究与自适应Web站点的构建
摘 要
在Web的应用和规模快速增长下,把数据挖掘技术应用于Web是—个极具挑
战性的研究方向。从Web服务器的日志挖掘中发现有用的,重要的知识(包括模
式、规则、可视化结构等),成为数据挖掘与知识发现的又一重要研究和应用领
域.本文作者对Web日志挖掘作了系统性的研究,通过对Web日志的挖掘,找出
用户浏览页面的关联规则、聚类信息、访问路径等,并把它们应用到Web站点的
智能化设计中。所作的工作主要有以下几个方面;
1. 本文介绍了Web数据挖掘的基本概念,分类,并给出Web数据挖掘的基
本原理,基本方法,并指出Web数据挖掘的用途.
2. 为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分柝用
户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就
此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充
等过程的数据预处理模型,并通过一个实例具体介绍各过程的主要任务。
3. 从Web日志挖掘过程预处理阶段的结果用户会话文件开始,提出了一种
基于扩展有向树模型进行用户浏览模式识别的Web日本挖掘方法,并在实验室对
该方法进行了简单实现和实际日志数据的测试。
4. 推荐是Web个性化服务的核心。提出一种自动分层推荐算法,利用页面
分层自动选择最佳的匹配粒度,进行基于频繁导航路径的推荐。实验结果表明,
该算法大大减少了在线匹配的开销,可以成功地应用到Web日志挖掘中。
5. 提出了一个基于Web日志挖掘技术的应用,即用户自适应的Web站点,
介绍了这一系统的实现方法和主要特色。
关键词:数据挖掘{Web日志挖掘;自适应Web站点
ABSTI醴CT
As
the andthescaleofthe increasefast.It
application Web becomes.an
to
researchdirection data to
theWeb。
extremelychallenging applyminingtechniques
forusefuland rules
Discovery patterns,association
importantknowledge(including
is
andvisible the ontheSeTVeF another
swnctures)fromW曲log becomingimportant
and area.Themade researchand
research authorin-depth inWeb
application analysis
this Wreb user arc
logmining.Inpaper,bymininglog,somebrowsingpatterns
suchasassociation andSOon.Then
discovered path
rule,clusteringpattern,accessing
文档评论(0)