- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
31(10)计算机工程与设计ComputerEngineeringandDesign
·开发与应用·
由Web日志确定页面访问时问的方法研究
霍晓钢
(浙江经济职业技术学院信息与控制技术学院,浙江杭州310018)
摘 要:为了获取用户访问页面的行为全过程以及准确时问,在网站中建立自动记录离开访问页面机制,准确的记录了用
户访问页面的行为的全过程,确保访问日志的完整性和准确性。在此基础上,提出了服务器访问日志数据清理算法,确保准
确提取出页面访问时间,从而解决了常见的页面访问时间算法不能准确确定每个页面被访问的确切时间的问题。
关键词:Web挖掘;访问时间;访问行为;数据清理;访问日志
中圈法分类号:TP391文献标识码:A 文章编号:1000-7024(20lo)10.2416-04
Researchon methodsofweb accesstimefromserver
statistical page logs
HUO
Xiao-gang
of and
(InstituteInformationandControl VocationalTechnical
Technology,Zhejiang CollegeEconomic,
31 001
8,China)
Hangzhou
Abstract:Inorderto obtainthetimethattheu硝玎visitstheweb.all recordmechanismis
accurately automatically
behaviorofauservisits tOensure
recordsthe timeofwebsite whole theweb the ofaccessservertimeis
leaving visited,the integrity
recorded.Onthis serveraccessdata isadvancedtoelBsureobtainthewebvisitedtime
foundation,a log cleaningalgorithm
the whichcan’tconfirmthevisitorialtimeforeachweb issolved.
therebyproblemofordinaryalgorithm exactly
words:web time;accessbehavior;data
Key mining;access cleaning;accesslog
度的确定存在不确定因素。
0引言
服务器访问日志一般称为Web日志,它记录了有关用户
访问页面的基本情况信息,是Web使用记录挖掘的主要数据
来源。通过挖掘Web日志记录,发现隐藏日志数据中的模式
信息,了解系统的访问模式以及用户的访问行为模式,从而作 示序号与用户访问页面时间长度(仅保留有效访问事务集酋
出用户行为的判断。用户访问页面的时间能够反映出用户访 条记录与末条记录)。
问页面行为、事务识别、页面重要性等网站建设的主要指标, 表1
文档评论(0)