- 3
- 0
- 约1.36万字
- 约 4页
- 2017-08-10 发布于北京
- 举报
第29卷 第22期 计算机工程与设计 2008年 11月
VO1.29 NO.22 ComputerEngineeringandDesign NOV.2008
改进的Web访问日志会话识别算法
严奉华, 刘建平, 杨凡丁
(浙江理工大学信息电子学院,浙江杭州310018)
摘 要:针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方
法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。
同时通过灵活界定 内容页,并针对内容页,提 出了一些启发式规则,突破 了 “参引长度法”所固有的一个会话 中只包含一个
内容页的瓶颈。该方法提高了会话识别的准确度 ,实验结果表 明是有效的。
关键词:Web日志挖掘;数据预处理;会话; 内容页;时间阀值;启发式规则
中图法分类号:TP391 文献标识码:A
您可能关注的文档
最近下载
- 2026广东东莞市谢岗控股集团有限公司办公室材料员及法务助理招聘2人笔试备考题库及答案解析.docx VIP
- 企业会计准则应用案例汇编2024.docx VIP
- 2023年日历全年表一张高清打印版.pdf VIP
- 传热学第四版完整版研讨.doc
- 上海市2025年普通高校招生本科录取控制分数线上考生高考成绩分布表.docx VIP
- 《前列腺癌诊疗指南(2022年版)》解读PPT课件.pptx VIP
- 〖GB_T51094-2015〗工业企业湿式气柜技术规范(高清-可复制).pdf VIP
- 湖北省部分高中协作体2024-2025学年高一下学期4月期中联考数学试卷(含详解).pdf VIP
- 译林版六年级英语上册期末复习:用所给词的适当形式填空.pdf VIP
- Koyo光洋 D4-454系列用户手册.pdf VIP
原创力文档

文档评论(0)