基于Web日志挖掘的自适应网站构建方法研究.docVIP

基于Web日志挖掘的自适应网站构建方法研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web日志挖掘的自适应网站构建方法研究 2010年第3期 计算饥与现代化 JlSUANJIYUXIANDAItlUA总第175期 文章编号:1006-2475(2010)03-0144-04 基于Web日志挖掘的自适应网站构建方法研究 母俐丽 (兰州交通大学电子与信息工程学院,甘肃兰州730070) 摘要:自适应网站能够提高网站对用户的服务质量.本文首先给出自适应网站的总体框架,对框架中主要模块做详细的 分析,包括数据预处理,数据挖掘,页面推荐和站点调整.在数据挖掘模块给出一种有效的识别用户访问模式的算法,该 算法利用数据库查询简化频繁最大前向访问路径集的查找,并在此基础上形成频繁访问路径图,为页面推荐和站点调整 做好准备.最后给出自适应网站的设计原则. 关键词:自适应网站;频繁访问路径图;页面推荐;站点调整;数据挖掘;Web日志 中图分类号:TP311文献标识码:Adoi:10.3969/j.issn.1006-2475.2010.03.041 ApproachofAdaptiveWebSiteConstructionBasedonWebLOgsMining MULi—li (InstituteofElectronicsandIrfformationEngineering,LanzhouJiaotongUniversity,Lanzhou730070,China) Abstract:AdaptiveWebsiteconstructionbasedonWebminingcouldimprovethesemdcequalityforusers.TheadaptiveWeb sitegeneralframeworkisproposed.Adetmledanalysisismadeformainmodulesoftheframework,includingdatapre.process. ing,datamining,pagerecommendationandsiteadjustment.Aneffectivealgorithmofuseraccesspatternsidentificationispro posedindataminingmodule.Thealgorithmutilizesdatabasequerytosimplifythefindofthemostfrequentacc(~sspathsset,and titanformsafrequencyaccesspatternsmappreparingforpagerecommendationandsiteadjusUnent.Finally,theadapfiveWeb sitedesignprinciplesaleproposed. Keywords:adaptiveWebsite;frequencyaccesspathsmap;pagerecommendation;siteadjustment;dataruing;Weblogs 0引言 自适应网站作为Web数据挖掘的重要研究方向 之一,日益受到关注,是未来网站的一个发展方向. 其目的是通过分析用户的访问日志,利用数据挖掘的 方法得到用户不同的访问兴趣,并将符合用户兴趣的 页面以链接列表等形式推荐给用户,为用户提供智能 化的服务. 1总体框架 一 个实用的自适应网站,可以分为离线部分和在 线部分,其总体框架如图1所示. (1)离线部分:进行数据的收集,预处理,完成发 现关联规则,频繁项集等频繁访问模式的挖掘.分为 数据预处理和数据挖掘两个模块.数据预处理模块 图l自适应网站框架 主要是对所收集的数据进行预处理,预处理后的数据 存入用户事务库,数据预处理的质量与挖掘的效率和 收稿日期:2009-07-31 作者简介:母俐丽(1980一),女,河北乐亭人,兰州交通大学电子与信息1二程学院硕士研究生,研究方向:Web数据挖掘,计算 机网络. 离线部分一布线部分 2010年第3期母俐丽:基于Web日志挖掘的自适应网站枸建方法研究145 结果紧密相关;数据挖掘模块主要是使用数据挖掘技 术如统计分析,聚类分析,关联规则,序列模式等,来 识别用户浏览模式,存入模式库. (2)在线部分:推荐引擎根据挖掘Ⅲ米的规则和 前刚户访问操作计算生成推荐集,然后在用户最新 请求的页i可上添加推荐页面,再通过Web服务器传 递到用户端的浏览器,为用户提供自适应的在线服 务,同时将推荐结果送往网站管理中心,以便调整网 站设计,优化刚站结构,提高网站效率. 总之,在自适应网站中运用数据挖掘技术可以分 为离线规则学习和在线模式应用两个阶段.在数据 挖掘模块中,通过具体的挖掘算法对Web日志进行 模式识别和模式分析,离线获取用户访问特征和规 则,存

文档评论(0)

湘雅书斋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5220142302000001

1亿VIP精品文档

相关文档