- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
576 2008中国发展进程中的管理科学与工程(卷I)
基于Web挖掘和站点拓扑的自适应网站研究
刘勰,王洪伟
同济大学经济与管理学院,上海200092
liuxieattong}i@163.tom,hwwang@mail.tongji.edu.ell
摘要:针对当前自适应网站文现领域研究的不足,尤其是缺乏对网站自身拓扑结构的分析,本文从用户的角度}H发,结
合Web日志挖掘和站点拓扑分析,提出r地标系数这一指标来衡苗网站结点的甭要性,并提出一种有建设意义的、自适应网
站的实现架构。随后,本文对一个原型系统进行了实验分析。结果表明,本文所述的自适应策略呵以很大程度.I:提高网站访
问者的访问效率。
关键词:自适应网站;WebF1志挖掘;拓扑结构;地标系数;动态地图
Schechter等提出根据用户的访问路径模式预测
1 引 言
用户未来可能的HTTP请求,让代理服务器执行顶取
随着WwW的普及与复杂度的提高,自适应的操作,将相关Web页放入其缓仔中,以加快访问速
Web站点显得越来越重要。自适应网站的基本特点 度[1]。Nasraol等采用聚类力‘法,分析用户访问模式,
在于:(1)为用户提供个性化服务。分析不同用户的兴 以此预测未来的访问行为[1]。华盛顿大学的研究人员
趣,动态地推荐其感兴趣的内容。(2)提高系统效率。 致力于自适应网站的系统优化,他们所设计的系统从
根据用户兴趣,对需求强烈的页面提供优化,或者通过 web站点日志中提取频繁出现的访问模式,据此对网
预测对即将访问的页面预先做好本地缓存工作,有助 站的结构进行调整,从而提高网站对大多数用户的服
于平衡服务器的负载,减少阻塞,缩短用户等待时间。 务性能心]。新加坡南洋大学、美国明尼苏达州立大学、
(3)优化网站结构没计。根据用户的历史访问情况,通 澳大利哑的SimonFraser大学也展开了相关研究,并
过挖掘用户使用模式,优化网站的结构,从而提高用户 推出一些原型系统,包括WebMinnerr3|,WebWatch—
err
的满意程度。 4|,WebLogMiner;5。。
市场营销中的经典原理——“消费者过去的消费 国内戴军湘、王书舟等人也通过Web挖掘,提炼
行为是今后消费倾向的最好说明”,同样适用于Web 出用户的特征,以此改进Web服务【1’2]。杜辉锋基于
领域。由于Web服务器日志中存储了大量的用户访 挖掘Web日志记录,同时融合了信息检索和信息过滤
问信息,对其挖掘可以提取出感兴趣的模式。 的相关技术,提出一种新颖的个性化网页推荐模型¨]。
此外,站点的拓扑结构也是自适应网站的重要研 但是,很多研究过多考虑用户的行为模式,巾i忽略
究内容。网页结点自身所处的深度、联通程度、用户对 了站点的拓扑结构。Web服务器口志挖掘针对用户
网页的偏好度等信息体现着该结点在网站地图中的性 的使用偏好,通过算法判断出用户的下一个访问行为。
质,研究这部分内容对于把握用户的访问偏好、方便用 然而,为r方便J甘户的访问,仅仅推荐显示用户接下来
户的访问都有重大的帮助。 最可能访问的结点还远远不够。原阂在于:(1)用户在
目前,国内外自适应网站研究主要集中在算法的 访问网站的时候,可能还希望了解自己在整个网站的
改进和应用系统框架的设计上。本文针对当前自适应 相对位置。因此需要网站中相埘苇要的结点被抽取出
网站实现领域研究的不足,尤其是缺乏对网站自身拓 来,并以适当的方式展示给用户。(2)根据用户访问记
扑结构的分析,从用户的角度出发,结合Web日志挖 录推断出的用户下一个访问结点未必是用户最终
您可能关注的文档
- 基于RAPD标记的中国板栗Castanea+mollissima遗传连锁图构建研究.pdf
- 基于WebShpere的企业门户构建及应用集成研究.pdf
- 基于WebSISP的两层空间信息语义集成框架研究.pdf
- 基于RASA的多Agent交互协议研讨.pdf
- 基于Rasch模型的自适应考试评估系统设计研究.pdf
- 基于Ratio的SAR图像边缘提取算法研究.pdf
- 基于Web和Java的远程控制与交互图像处理研讨.pdf
- 基于Web和Matlab的网络教学实验系统设计研究.pdf
- 基于Web和VRML技术的土木工程结构系列课程CAI多媒体课件的研制研究.pdf
- 基于Web技术的DTS联合反事故演习研究.pdf
文档评论(0)