- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web日志挖掘的自适应网站构建方法研究
2010年第3期
计算饥与现代化
JlSUANJIYUXIANDAItlUA总第175期
文章编号:1006-2475(2010)03-0144-04
基于Web日志挖掘的自适应网站构建方法研究
母俐丽
(兰州交通大学电子与信息工程学院,甘肃兰州730070)
摘要:自适应网站能够提高网站对用户的服务质量.本文首先给出自适应网站的总体框架,对框架中主要模块做详细的
分析,包括数据预处理,数据挖掘,页面推荐和站点调整.在数据挖掘模块给出一种有效的识别用户访问模式的算法,该
算法利用数据库查询简化频繁最大前向访问路径集的查找,并在此基础上形成频繁访问路径图,为页面推荐和站点调整
做好准备.最后给出自适应网站的设计原则.
关键词:自适应网站;频繁访问路径图;页面推荐;站点调整;数据挖掘;Web日志
中图分类号:TP311文献标识码:Adoi:10.3969/j.issn.1006-2475.2010.03.041
ApproachofAdaptiveWebSiteConstructionBasedonWebLOgsMining
MULi—li
(InstituteofElectronicsandIrfformationEngineering,LanzhouJiaotongUniversity,Lanzhou730070,China)
Abstract:AdaptiveWebsiteconstructionbasedonWebminingcouldimprovethesemdcequalityforusers.TheadaptiveWeb
sitegeneralframeworkisproposed.Adetmledanalysisismadeformainmodulesoftheframework,includingdatapre.process.
ing,datamining,pagerecommendationandsiteadjustment.Aneffectivealgorithmofuseraccesspatternsidentificationispro
posedindataminingmodule.Thealgorithmutilizesdatabasequerytosimplifythefindofthemostfrequentacc(~sspathsset,and
titanformsafrequencyaccesspatternsmappreparingforpagerecommendationandsiteadjusUnent.Finally,theadapfiveWeb
sitedesignprinciplesaleproposed.
Keywords:adaptiveWebsite;frequencyaccesspathsmap;pagerecommendation;siteadjustment;dataruing;Weblogs
0引言
自适应网站作为Web数据挖掘的重要研究方向
之一,日益受到关注,是未来网站的一个发展方向.
其目的是通过分析用户的访问日志,利用数据挖掘的
方法得到用户不同的访问兴趣,并将符合用户兴趣的
页面以链接列表等形式推荐给用户,为用户提供智能
化的服务.
1总体框架
一
个实用的自适应网站,可以分为离线部分和在
线部分,其总体框架如图1所示.
(1)离线部分:进行数据的收集,预处理,完成发
现关联规则,频繁项集等频繁访问模式的挖掘.分为
数据预处理和数据挖掘两个模块.数据预处理模块
图l自适应网站框架
主要是对所收集的数据进行预处理,预处理后的数据
存入用户事务库,数据预处理的质量与挖掘的效率和
收稿日期:2009-07-31
作者简介:母俐丽(1980一),女,河北乐亭人,兰州交通大学电子与信息1二程学院硕士研究生,研究方向:Web数据挖掘,计算
机网络.
离线部分一布线部分
2010年第3期母俐丽:基于Web日志挖掘的自适应网站枸建方法研究145
结果紧密相关;数据挖掘模块主要是使用数据挖掘技
术如统计分析,聚类分析,关联规则,序列模式等,来
识别用户浏览模式,存入模式库.
(2)在线部分:推荐引擎根据挖掘Ⅲ米的规则和
前刚户访问操作计算生成推荐集,然后在用户最新
请求的页i可上添加推荐页面,再通过Web服务器传
递到用户端的浏览器,为用户提供自适应的在线服
务,同时将推荐结果送往网站管理中心,以便调整网
站设计,优化刚站结构,提高网站效率.
总之,在自适应网站中运用数据挖掘技术可以分
为离线规则学习和在线模式应用两个阶段.在数据
挖掘模块中,通过具体的挖掘算法对Web日志进行
模式识别和模式分析,离线获取用户访问特征和规
则,存
文档评论(0)